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Después de siete años de vigencia, intuimos que había llegado el momento de reeditar el texto origi- 
nal Diseños Experimentales en Psicología de 2007. La primera de las razones que nos animaron a tomar 
esta decisión tuvo su raíz en las sugerencias de cambio que muchos de nuestros alumnos y colegas de 
Universidad nos han hecho llegar a lo largo de estos años con el objeto de facilitar el trabajo con un 
texto que en general se ha considerado riguroso, pero extenso y difícil. La segunda razón fue nuestra 
convicción de que el material empleado en el original podía ser susceptible de mejora en este sentido 
para adaptarse a las demandas de estudiantes e investigadores. 

Pero lo que en un principio se ideó como una segunda edición, fue transformándose lentamente 
durante el proceso de reedición hasta convertirse en un nuevo texto con una gran parte del contenido 
del original para el que creemos oportuno adoptar la etiqueta de Diseños de investigación en Psicología, 
una denominación que coincide con el de la asignatura que pretende cubrir en muchas de nuestras 
universidades, y particularmente en las Universidades de Murcia y Oviedo. En gran medida este cambio 
de orientación se ha debido a la reciente disponibilidad de un sistema de clasificación de los diseños 
de investigación (Ato, López y Benavente, 2013). Cabe no obstante advertir al lector que en este texto 
se tratan en detalle los diseños de la estrategia manipulativa (experimental, cuasiexperimental y caso 
único) y mucho más brevemente los diseños de la estrategia asociativa (comparativos, predictivos y ex- 
plicativos), pero no se tratan los diseños de la estrategia descriptiva (de encuesta y observacionales). Sin 
embargo, esta decisión está bien justificada porque en muchas de nuestras Universidades se imparten 
cursos puntuales de metodología observacional y metodología de encuesta. 

Como el original de 2007, Diseños de investigación en Psicología mantiene la misma filosofía de tra- 
bajo, el enfoque del modelado estadístico, que articula nuestra concepción de la aplicación del análisis 
estadístico en el marco del diseño de investigación. El primero de los capítulos del texto ofrece una vi- 
sión general de las estructuras jerárquicas que fundamentan el enfoque del modelado estadístico para la 
investigación en las Ciencias del Comportamiento y muchas áreas de las Ciencias Sociales y las Ciencias 
de la Salud, desde la estructura básica del modelo lineal clásico, ala moderna estructura de los modelos 
de ecuaciones estructurales. 

Los cuatro capítulos siguientes constituyen un curso intermedio sobre Análisis de Datos. Desde 
nuestro punto de vista representan en conjunto una herramienta imprescindible para poder abordar 
con rigor los fundamentos del diseño experimental y no experimental. Se tratan en detalle los mode- 
los de regresión (capítulo 2), los modelos ANOVA y MANOVA de efectos fijos (capítulo 3), los modelos 
ANOVA con efectos aleatorios y mixtos (capítulo 4) y los modelos ANCOVA (capítulo 5). Buena parte del 
contenido de esta primera parte es materia que suele impartirse en un curso previo de Análisis de Da- 
tos, aunque en este texto se orienta desde el enfoque del modelado estadístico. Pero lo más sustancial 
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de esta primera parte no suele ser objeto de un curso introductorio de Análisis de Datos. Cuestiones ta- 
les como el problema de la multicolinealidad, los modelos de mediación y moderación, el tratamiento 
de los modelos ANOVA con efectos aleatorios y mixtos, el análisis multinivel, el análisis MANOVA y el 
análisis de covarianza son temas que requieren cierta familiarización por parte de los estudiantes antes 
de acometer los contenidos propios del diseño de investigación. 

Los siguientes capítulos representan la parte esencial del texto, donde después de una breve intro- 
ducción al diseño de investigación (capítulo 6) se tratan los fundamentos del diseño con un marcado 
énfasis en el diseño experimental (capítulos 7 a 10), el diseño cuasiexperimental (capítulo 11) y el diseño 
de caso único (capítulo 12), y con mucho menor énfasis los diseños no experimentales, y en concreto 
los diseños comparativos, predictivos y explicativos (capítulo 13). 

Además del cambio de orientación que justifica una nueva denominación, son muchos los cambios 
que hemos introducido respecto del original de 2007. En lo referente a los contenidos teóricos, las mo- 
dificaciones más sustanciales se han producido, sobre todo, en la separación de los efectos fijos y los 
efectos aleatorios y mixtos, la introducción del análisis multivariante de varianza y el análisis multini- 
vel, la estimación de modelos ANCOVA con pendientes no paralelas, el tratamiento de los modelos de 
moderación y las técnicas de control de variables extrañas, pero también se tratan a nivel introductorio 
otras cuestiones de interés, tales como los valores perdidos, la potencia observada con efectos aleatorios 
y el diseño doblemente multivariante. Respecto a cuestiones no sustantivas, lo más destacable son los 
numerosos ejemplos publicados de aplicaciones de diseño que se incorporan en la segunda parte del 
texto y los cambios que se han producido en las salidas más complejas, particularmente la de los mo- 
delos multivariantes y mixtos. Presentamos una propuesta de tabla única como resumen de varias de 
las salidas típicas del programa SPSS para salidas del análisis multivariante del análisis multinivel. Otro 
cambio destacable es la utilización del programa ggplot del sistema R para la realización de los gráficos. 

Con todo, el texto ha sufrido también un recorte importante en el número de páginas, del orden de 
un 25% respecto del original de 2007. En gran medida este recorte se ha debido a que hemos prescindido 
de los apéndices, glosario y sintaxis de SPSS y se ha ampliado la anchura de la caja respecto del texto 
original. Aunque el material del texto de 2007 puede seguir siendo utilizado, ponemos a disposición del 
lector, bien en la página web de Pirámide, en la URL dedicada al texto, el acceso a todos los materiales de 
sintaxis y alos ejercicios prácticos que desarrollamos para nuestros alumnos, así como algunos ejemplos 
comentados de investigaciones publicadas. 

Este texto no se hubiera planteado en sus actuales coordenadas sin las sugerencias que nos han 
hecho llegar alumnos e investigadores que han dedicado su esfuerzo a comprender y aplicar los conte- 
nidos del texto de 2007. La demanda de atención y concentración que exige escribirlo no habría sido en 
absoluto posible de no haber sido por la estoica resistencia de nuestras respectivas esposas, María Ánge- 
les y María Teresa, a prescindir de nosotros durante todo un semestre, incluyendo fechas tan señaladas 
como las Navidades de 2014. 


Manuel Ato y Guillermo Vallejo, enero 2015. 
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1.1. INTRODUCCIÓN 


Las observaciones realizadas por investigadores de las Ciencias del Comportamiento contienen in- 
formación crucial acerca del comportamiento humano y su entorno social. Recuperar esta información 
puede ser difícil, sobre todo si las observaciones son muy numerosas o muy complejas, pero resulta 
más simple cuando los expertos tienen alguna idea preconcebida sobre la información presente en los 
datos, o sea, acerca de su estructura. Las ideas que los investigadores tienen acerca de la estructura de 
los datos se denominan MODELOS. El concepto de modelo se utiliza aquí como una forma de simplifi- 
car la realidad empírica, en el mismo sentido que se emplea una maqueta a escala de una vivienda o 
de un automóvil, con el objeto de aproximar con la mayor precisión posible la realidad empírica que 
el modelo (o la maqueta) trata de capturar. Los modelos pueden clasificarse como DETERMINÍSTICOS, 
donde las entradas y salidas del sistema se definen con precisión, sin variación aleatoria, como sucede 
con muchas leyes de la Física y la Ingeniería, y modelos PROBABILÍSTICOS, donde las entradas y salidas 
del sistema exhiben cierta variación aleatoria, como sucede con casi todos los modelos que se emplean 
en Psicología, en la encrucijada entre las Ciencias de la Salud y las Ciencias Sociales. 


Para tratar la variación aleatoria presente en los modelos probabilísticos se utiliza una herramienta 
básica, la INFERENCIA ESTADÍSTICA. El enfoque tradicional con el que se realiza la inferencia estadísti- 
ca en Psicología y disciplinas afines se fundamenta en el contraste de hipótesis estadísticas mediante 
pruebas de significación (a veces complementada con la estimación de intervalos de confianza y de ta- 
maños del efecto) siguiendo el modo de proceder típico de la estadística clásica o fisheriana. Por esta 
razón este enfoque se denomina ENFOQUE DEL CONTRASTE DE HIPÓTESIS (o abreviadamente, ENFOQUE 
NHST, de Null Hypothesis Significance Testing). Muchas de las críticas que ha recibido este enfoque 
(véase Balluerka, Gómez e Hidalgo, 2005; Cohen 1994; Cumming, 2013; Judd, McClelland y Culhane, 
1995; Kline, 2004; Krantz, 1999; Nickerson, 2000 y Thompson, 2002b, entre otros) argumentan que el 
objeto de las pruebas de significación es diferente del objeto de la inferencia científica y que se requie- 
re complementar y ampliar el horizonte de las pruebas de significación. Lo que realmente interesa es: 
"dados unos datos empíricos, ¿cuál es la probabilidad de la hipótesis?", pero lo que las pruebas de sig- 
nificación plantean es: "asumiendo que la hipótesis nula es cierta, ¿cuál es la probabilidad de los datos 
empíricos?". Obviamente, la hipótesis nula no suele ser precisamente la hipótesis más informativa que 
puede someterse a prueba. 
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Un enfoque complementario al enfoque NHST se perfiló durante las décadas de los años ochenta y 
noventa, representando una revolución pacífica y silenciosa contra el enfoque NHST. Este nuevo enfo- 
que se basa en el ajuste y comparación de modelos probabilísticos, y se conoce como ENFOQUE DE LA 
COMPARACIÓN DE MODELOS. Rodgers (2010) ha descrito su historia y sus características, en la que han 
tenido un protagonismo esencial, entre otros, los textos de Judd, McClelland y Ryan (2008, 12 edición 
1989) y Maxwell y Delaney (2004, 12 edición 1990). 

El eje central de este nuevo enfoque es un procedimiento integrado y coherente denominado MO- 
DELADO ESTADÍSTICO (statistical modelling) que, en el caso más simple, consiste en la aplicación de una 
serie de procesos con el objeto de conseguir una explicación apropiada del comportamiento de una va- 
riable de respuesta (los DATOS) a partir de una función ponderada de una o más variables explicativas 
(el MODELO). Como en todo modelo probabilístico, la explicación en general no suele ser perfecta, y 
por tanto es preciso evaluar la discrepancia existente entre los Datos y el Modelo (el ERROR O RESIDUAL) 
en términos de alguna medida diferencial al uso. El resultado es la ECUACIÓN GENERAL DEL MODELADO 
ESTADÍSTICO, que se expresa en los términos siguientes: 


Y; = Hi “E ei a.D 


DATOS = MODELO + | ERROR 


La ecuación 1.1 establece que los datos empíricos contenidos en un vector de VALORES OBSERVADOS 
(Y;), correspondiente a una variable de respuesta, son una función de un vector de VALORES ESTIMADOS 
(1), que constituye el componente sistemático, representado por algún modelo teórico apropiado, y 
un vector RESIDUAL, que representa la discrepancia existente entre los valores observados y los valores 
estimados por el modelo (e; = Y; — 4;), y constituye el componente aleatorio. 

En este capítulo se presenta de forma simplificada el proceso general de modelado estadístico y se 
introducen las estructuras básicas de los modelos más representativos de la investigación en psicolo- 
gía, algunos de los cuales serán objeto de estudio intensivo en los siguientes capítulos del texto. Más 
información sobre el proceso de modelado estadístico puede consultarse en Krzanowski (1998). 


1.2. ELPROCESO DE MODELADO ESTADÍSTICO 


El objeto fundamental del modelado estadístico es la búsqueda y detección del modelo más parsi- 
monioso que sea capaz de explicar una variable de respuesta con el mínimo error posible. La secuencia 
de aplicación del proceso de modelado estadístico se resume en el diagrama de la figura 1.1 y contiene 
una serie de etapas claramente diferenciadas, al término de las cuales el investigador debe disponer de 
información suficiente para determinar si un modelo es aceptable o no como predicción o explicación 
de la/s variable/s de respuesta. 

En primer lugar, es importante distinguir entre las formas más comunes que suele presentar la va- 
riable de respuesta. En el cuadro 1.1 se distinguen cinco grandes tipos de variables de respuesta, que 
representan un amplio espectro de opciones, junto con las distribuciones de probabilidad que asumen, 
las restricciones de uso que plantean y algunos ejemplos. 
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CUADRO 1.1 
Tipos de variables de respuesta 


Variable de respuesta — Distribución Restricciones Ejemplos comunes 
Numérica Normal Ninguna Puntuación global en un test 
Recuento Poisson Valores no negativos No errores cometidos en una tarea 

Proporción/Tasa Binomial Escala de probabilidad | Proporción de aciertos 


Tasa Poisson Escala de probabilidad | Tasa de errores por minuto 
Ordinal Multinomial | Categorías de la escala | Ítem formulado en escala Likert 
Binaria Bernouilli Respuesta dicotómica Ítem en escala binaria (V/F) 


ESPECIFICACIÓN 


| 


AJUSTE 


| 


EVALUACIÓN 


| 


INTERPRETACIÓN 


Reespecificación 


Figura 1.1. — El proceso de modelado estadístico. 


El uso habitual de los modelos en el proceso de modelado estadístico requiere conocer la termino- 
logía apropiada para distinguirlos. Por orden de complejidad, puede distinguirse un MODELO PERFECTO 
O SATURADO (MS), que se caracteriza porque tiene tantos parámetros como observaciones, y por tanto 
reproduce los datos empíricos exactamente, sin ninguna simplificación, ya que valores observados y 
valores estimados son exactamente iguales. En este sentido, el modelo saturado es el modelo más com- 
plejo y menos parsimonioso de todos los modelos, pero en general no todos los parámetros del modelo 
saturado son de interés. Por el contrario, el modelo más simple (o más parsimonioso) posible es el mo- 
delo que no incluye ninguna variable explicativa y por ello se denomina MODELO NULO O BASAL (M0). No 
obstante, este modelo tiene un parámetro, que representa el valor medio común a todas las observacio- 
nes, pero usualmente no es representativo para explicar los datos empíricos. El modelo que concentra 
todos los parámetros de interés del investigador, excluyendo los demás, se denomina MODELO MÁXIMO. 
Entre el modelo máximo y el modelo nulo se encuentran muchos posibles MODELOS DE TRABAJO que 
pueden tener interés potencial para el investigador. El objetivo del modelado es encontrar un modelo 
aceptable de entre todos los modelos de trabajo posibles. En general, un modelo se considera óptimo 
cuando es parsimonioso (es decir, no incluye parámetros irrelevantes) y obtiene un ajuste aceptable (es 
decir, su discrepancia respecto del modelo saturado o del modelo nulo es mínima). 

Cuando se comparan modelos, usualmente se utilizan dos modelos alternativos: un MODELO RES- 
TRINGIDO, que contiene un número básico de parámetros, y un MODELO AMPLIADO, que contiene uno 
o más parámetros adicionales respecto del modelo restringido, con el objeto de determinar cuál de los 
dos obtiene mejor ajuste. 
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1.2.1. Primera etapa: especificación 


En la primera etapa del proceso, el investigador, basándose en su propia intuición, en el conocimien- 
to sustantivo de la temática objeto de investigación o en resultados derivados de modelos anteriores so- 
metidos a prueba, especifica un modelo teórico de su interés. Especificar un modelo teórico consiste en 
proponer una combinación particular de un conjunto de p predictores o variables explicativas X;, con 
valores X;;, y de un conjunto de q parámetros 6; (para j = 1,..., q), que puede incluir una constante 
opcional (fp), con el objeto de pronosticar los valores Y; de la variable de respuesta Y, para la que se 
asume una distribución determinada. Los dos ingredientes básicos de la especificación del modelo son 
los componentes fijo y aleatorio. 


1. El COMPONENTE FIJO O SISTEMÁTICO se propone identificar las variables explicativas más relevan- 
tes con el objeto de predecir o explicar óptimamente el comportamiento de una variable de res- 
puesta y consiste en formular una ecuación con las variables X; y sus respectivos parámetros Bj. 
Los parámetros son pesos diferenciales que representan la capacidad potencial de una variable 
explicativa para predecir o explicar una variable de respuesta. El compuesto resultante de com- 
binar para cada uno de los í casos los valores X;¡ y sus parámetros f; es un vector denominado 
PREDICTOR LINEAL, que se simboliza como 7);, y se define como 


p 
i=Bo+) P¡Xij (1.2) 
j=1 


El vector 7; asume que la función que relaciona las variables explicativas y los parámetros es 
lineal, la función más frecuentemente encontrada en investigación aplicada. Afortunadamente, 
algunas funciones que no tienen naturaleza estrictamente lineal pueden ser fácilmente transfor- 
madas en funciones lineales y otras muchas funciones pueden ser tratadas como intrínsecamente 
lineales. En escasas aplicaciones de la psicología, sin embargo, se requiere utilizar modelos intrín- 
secamente no lineales (véase Bates y Watts, 2008). 


2. El COMPONENTE ALEATORIO O DE ERROR se propone capturar la variación aleatoria individual me- 
diante la selección de una distribución de probabilidad para la variable de respuesta, cuyos pa- 
rámetros básicos, el valor esperado, E(Y;), y la varianza, V (Y;), juegan un papel primordial. En el 
modelo lineal clásico, el valor esperado es igual a la media de la variable de respuesta, 


E(Y) =Hi (1.3) 


y SU VARIANZA es una función que se define como el producto 


V(Y)=9V (ui) (1.4) 
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donde « es el PARÁMETRO DE ESCALA O DISPERSIÓN de la distribución de probabilidad y V(u;) es 
un término que permite determinar la relación existente entre la media y la varianza, una relación 
que en general depende de la distribución de probabilidad seleccionada. 


Puesto que el vector de valores estimados 1; y el vector del predictor lineal 7; no necesariamente se 
miden en la misma escala, es preciso definir alguna transformación de la escala del predictor lineal a la 
escala del valor esperado, que se requiere para utilizar la ecuación 1.1. Tal vínculo se denomina FUNCIÓN 
DE ENLACE y se formula como 


mi=8(u) 12) 


siendo su función inversa 


pi=8 7 (95) 11,8) 


Cuando el vector del predictor lineal y el vector de valores estimados son iguales, entonces no hay 
necesidad de transformación. Formalmente, sin embargo, se dice que la transformación utilizada es la 
FUNCIÓN DE ENLACE IDENTIDAD, 


Ni= 8 (15) = Hi (1.7) 


En otras ocasiones, los vectores 7; y 1; no coinciden y entonces se requiere definir una función de enla- 
ce. Por ejemplo, en modelos que emplean variables de recuento como variables de respuesta y asumen 
una distribución de Poisson, la transformación entre predictor lineal y valor esperado suele ser la FUN- 
CIÓN DE ENLACE LOGARÍTMICO, 


8 (11) =log(u;) (1.8) 
g mi) =exp(m;) 


Mi 
Mi 


mientras que, para modelos que emplean variables categóricas binarias o dicotómicas como variables 
de respuesta y que asumen una distribución binomial, la transformación entre predictor lineal y valor 
esperado suele ser la FUNCIÓN DE ENLACE LOGIT, 


Mm =  g(u)=logit(u)= 1og[ 4) (1.9) 
Y 
-1 pa exp(ni) ] 1 
¡ = ¡)=1 t ¡) = = 
dd ESAS Na 1+exp(n;) 1+exp 
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La figura 1.2 es una representación jerárquica de las estructuras básicas que fundamentan el enfo- 
que del modelado estadístico para la investigación en Psicología. Asumiendo cualquier distribución de 
la FAMILIA EXPONENCIAL DE DISTRIBUCIONES, una extensa familia que incluye las distribuciones nor- 
mal, binomial, multinomial y Poisson como casos particulares, y una o más variable/s de respuesta de 
cualquier naturaleza (véase cuadro 1.1), esta representación distingue cinco estructuras de modelado. 


SEM 


GLMM 


Figura 1.2. — Representación jerárquica de las estructuras básicas del modelado estadístico. 


— La estructura del MODELO LINEAL CLÁSICO (o estructura LM, Linear Model), es la más básica y sus 
modelos se caracterizan por utilizar una variable de respuesta numérica que se asume distribuida 
normalmente. Los principales modelos que incluye esta estructura son los MODELOS DE REGRE- 
SIÓN, que emplean como componentes fijos/sistemáticos predictores de naturaleza numérica, los 
MODELOS ANOVA, que utilizan predictores categóricos, y los MODELOS ANCOVA, que usan una 
mezcla de predictores numéricos y categóricos. Estos tres modelos tienen en común el empleo de 
un único componente aleatorio. Se utilizan profusamente en la investigación psicológica y serán 
objeto de tratamiento en los capítulos 2 a 4. 


— La estructura del MODELO LINEAL GENERALIZADO (o estructura GLM, Generalized Linear Model, 
se caracteriza por incluir cualquier variable de respuesta (numérica o categórica) y una distribu- 
ción de la familia exponencial (véase Olsson, 2002). Aunque un caso particular de la estructura 
GLM es la estructura LM, que asume una distribución normal, dada su importancia en la inves- 
tigación en Psicología en este texto se trata de forma separada. Todos los modelos derivados de la 
estructura GLM asumen también la existencia de un componente aleatorio único. 


— La estructura del MODELO LINEAL MIXTO (o estructura LMM, Linear Mixed Model) se diferencia 
de la estructura GLM porque sus modelos permiten incluir más de un componente aleatorio, 
pero, como los modelos LM, asumen también una variable de respuesta numérica distribuida 
normalmente. La estructura LM puede ser también considerada como un caso particular de la 
estructura LMM caracterizada por incluir un único componente aleatorio. 
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— La estructura del MODELO LINEAL MIXTO GENERALIZADO (0 estructura GLMM, Generalized Linear 
Mixed Model) engloba las dos estructuras básicas, GLM y LMM, permitiendo especificar modelos 
con dos o más componentes aleatorios, una variable de respuesta de cualquier naturaleza (nu- 
mérica o categórica) y cualquier distribución de la familia exponencial (véase McCulloch, Searle 
y Neuhaus, 2008). Dos características peculiares de esta estructura, y de todas las subestructuras 
que incluye, es que sólo admite una variable de respuesta y que tanto las variables explicativas 
como las variables de respuesta deben ser variables observables. 


— La estructura del MODELO DE ECUACIONES ESTRUCTURALES (0 estructura SEM, Structural Equa- 
tion Model) generaliza los modelos GLMM permitiendo incluir más de una variable de respuesta 
(y no sólo una) en un sistema de ecuaciones con variables tanto observables (manifiestas) como 
no observables (latentes). No es posible utilizar ecuaciones múltiples en estructuras jerárquica- 
mente inferiores (véase Kaplan, 2009; Kline, 2011). 


La gran mayoría de los modelos estadísticos que se emplean en la investigación psicológica per- 
tenecen a alguna de las estructuras citadas. Es esencial que el investigador que trabaja con modelos 
estadísticos conozca bien el repertorio de estructuras de que dispone y las propiedades de los modelos 
que incluyen tales estructuras con el objeto de utilizarlos e interpretarlos adecuadamente. 


1.2.2. Segunda etapa: ajuste 


Una vez formulado un modelo estadístico, en la segunda etapa del proceso el investigador procede 
primero a estimar sus parámetros con un procedimiento de estimación apropiado. 


— Con modelos de la estructura LM, que asumen una distribución normal y una respuesta numé- 
rica, el método usual de estimación de parámetros es MÍNIMOS CUADRADOS (OLS), que persigue 
como criterio objetivo minimizar la suma de los cuadrados de las diferencias entre valores obser- 
vados y valores estimados, o sea, la suma de los cuadrados de los errores residuales. 


— Con otros modelos de la estructura GLM que no asumen distribución normal ni utilizan una va- 
riable de respuesta necesariamente numérica, y también en los modelos GLMM y SEM, el mé- 
todo de estimación más común es MÁXIMA VEROSIMILITUD (ML), que persigue como criterio ob- 
jetivo maximizar la FUNCIÓN DE VEROSIMILITUD, una función de las diferencias entre los valores 
estimados de un modelo respecto de los valores observados. Es importante notar que los objetivos 
de ambos métodos (OLS y MV) son similares en su finalidad, ya que el resultado de minimizar las 
diferencias entre valores observados y esperados es en gran medida equivalente al de maximizar 
una función de las diferencias entre valores observados y estimados. 


Una vez estimados los parámetros de un modelo, se obtiene el correspondiente predictor lineal y 
después se aplica la correspondiente función de enlace para obtener el vector de valores estimados. Fi- 
nalmente, se calcula una medida de la discrepancia entre los datos (los valores observados) y el modelo 
propuesto para explicarlos (los valores estimados) con la finalidad de determinar el ajuste del modelo 
a los datos empíricos. La medida más común de discrepancia es la DESVIANZA RESIDUAL (Dr, o simple- 
mente D), definida como D = —2LL, donde LL (LogLikehood) es el logaritmo de (natural) de la función 
de verosimilitud maximizada del modelo propuesto. En general, cuanto mayor sea la desvianza peor 
será el ajuste del modelo. En el extremo, cuando LL = 0 se trata de un modelo perfecto o saturado. Toda 
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medida de desvianza se asocia con unos grados de libertad, que son la diferencia entre el número de 
observaciones (NW) y el número de parámetros (q) que requiere la especificación del modelo. 


Hay dos procedimientos generales de ajuste de modelos: ajuste global y ajuste condicional. Partien- 
do del principio de que un modelo mal ajustado no es un modelo interpretable, el AJUSTE GLOBAL se 
propone con el objeto de determinar si un modelo individual es una aproximación aceptable de los 
datos empíricos. Dado un modelo de trabajo M1 correctamente especificado, y siendo MS el modelo 
saturado o perfecto y MO el modelo nulo o basal, el AJUSTE GLOBAL ABSOLUTO indaga si el modelo M1 
incluye un número suficiente de parámetros intentando responder a la cuestión: ¿difiere M1 del mo- 
delo saturado MS? Por el contrario, el AJUSTE GLOBAL RELATIVO indaga si los parámetros que incluye el 
modelo son en su conjunto necesarios intentando responder a la cuestión: ¿difiere M1 del modelo nulo 
MO? No obstante, conviene tener presente que éste es todavía un tema controvertido y que hay sensibles 
diferencias en la forma de evaluar el ajuste global entre las diferentes estructuras de modelado. 


— Si M1 es un modelo de la estructura LM, el proceso de ajuste implica una descomposición de la 
variación de la variable de respuesta (la Suma de Cuadrados Total, SCT) en una parte explicada 
por el modelo (la Suma de Cuadrados del Modelo, SCy) y otra parte no explicada (la Suma de 
Cuadrados Residual, SCr), según la ecuación 1.1. La desvianza residual del modelo M1 es la SC 
Residual, D(M1) = SCp, con grados de libertad residuales g/r = N— q, donde N es el número de 
observaciones y q es el número de parámetros del modelo. El AJUSTE GLOBAL ABSOLUTO no se pue- 
de valorar para esta estructura. El AJUSTE GLOBAL RELATIVO compara la desvianza del modelo M1 
con la desvianza del modelo nulo MO. El modelo nulo no tiene variables explicativas, pero emplea 
la misma variable de respuesta y su desvianza es D(MO) = SCr, con grados de libertad g/7 = N-1, 
porque sólo requiere estimar un parámetro. El resultado del ajuste se evalúa utilizando la PRUEBA 
DE LA RAZÓN DE VARIANZAS con la distribución F a un nivel de significación establecido. Cuan- 
do el resultado de la prueba es significativo, el modelo se considera bien ajustado; cuando no es 
significativo, el modelo se considera inaceptable o incompatible con los datos empíricos. 


— Si Ml es un modelo de la estructura GLM o LMM, el proceso de estimación obtiene el logaritmo 
(natural) de la función de verosimilitud maximizada (LL), y su desvianza es D(M1) = -2LL(MD), 
con grados de libertad g!(M1) = N— q. El AJUSTE GLOBAL ABSOLUTO compara la desvianza del 
modelo M1 con la del modelo saturado, o sea, del modelo que tiene de desvianza D(MS) =0 y 
grados de libertad gl! (MS) = 0. Para ello se emplea la PRUEBA DE LA RAZÓN DE VEROSIMILITUD, 
12(MD) = D(MID) - D(MS) = D(MD), con grados de libertad g!(M1) = N-— q, o sea, simplemente 
la desvianza residual con sus grados de libertad. El valor de L? se distribuye según x? y tiene ex- 
celentes propiedades asintóticas (el cociente L?/g1 tiende a uno cuando el ajuste es óptimo), de 
tal forma que cuando el resultado no es significativo el modelo se considera bien ajustado, mien- 
tras que cuando es significativo, se considera inaceptable o incompatible con los datos empíricos. 
Pero en afinidad con los modelos LM, el AJUSTE GLOBAL RELATIVO implica una descomposición 
de la desvianza total (Dr, con g!y = N-— 1) en un componente explicado por el modelo (Dr, con 
£g lu = 9-1) y un componente no explicado (Dr, con glg = N— q). El proceso compara la desvian- 
Za del modelo M1 respecto de la desvianza del modelo nulo [D(M1) — D(MO) = Dr- Dr = Dn] 
utilizando también la prueba de la razón de verosimilitud, con grados de libertad igual a la diferen- 
cia entre los grados de libertad de ambos modelos. En este caso, el ajuste se considera aceptable 
cuando 1? es significativo, y no aceptable cuando 1? no es significativo. 
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Una vez determinado si el modelo se ajusta o no, el investigador puede cuestionarse si los compo- 
nentes especificados en un modelo son o no significativos y proceder, si cabe, a su simplificación: 


— Con modelos de la estructura LM, este proceso tiene lugar utilizando contraste de hipótesis sobre 
los componentes del modelo con la PRUEBA £ DE STUDENT O también con la razón F equivalente. 


— Con modelos de la estructura GLM y LMM, el proceso se realiza usando contraste de hipótesis 
con la PRUEBA f DE STUDENT y la distribución £ (o también en ocasiones con la prueba Z y la 
distribución normal) para los efectos fijos, y con la PRUEBA Z DE WALD con la distribución y? 
equivalente para los efectos aleatorios. 


El ajuste global permite determinar si un modelo particular se ajusta aceptablemente o no, o sea si es 
adecuado o inadecuado para explicar los datos observados. Pero esta conclusión no implica que sea un 
modelo óptimo, ni que sea el mejor modelo de todos los posibles. Pueden existir otros muchos modelos 
que se ajusten adecuadamente. En estos casos el investigador tiene que recurrir a la comparación de 
dos (o más) modelos alternativos para determinar cuál de los dos ajusta mejor. 

La comparación de dos modelos solamente puede realizarse cuando se trata de MODELOS ANIDA- 
DOS, es decir, cuando uno de los modelos sea parte de otro, del que difiere en el número de parámetros. 
El proceso de ajuste que se emplea en estas ocasiones se denomina AJUSTE CONDICIONAL y permite 
concluir si un modelo más simple, el modelo restringido, porque cuenta con menor número de paráme- 
tros, representa una desviación significativa de un modelo más complejo, el modelo ampliado, porque 
cuenta con mayor número de parámetros. La comparación entre los dos modelos recurre también a la 
PRUEBA DE LA RAZÓN DE VEROSIMILITUD, que se interpreta en función del resultado de la inferencia es- 
tadística en los términos siguientes: si hay diferencias significativas entre los dos modelos, entonces el 
modelo más complejo (modelo ampliado) será considerado mejor que el modelo más simple (modelo 
restringido); en cambio, si no hay diferencias entre los dos modelos entonces el modelo restringido se 
considera mejor que el modelo ampliado. 

Puesto que el ajuste condicional mediante la comparación de modelos es un proceso tedioso, puede 
servir de ayuda el empleo de algún CRITERIO DE INFORMACIÓN, como el CRITERIO AIC (Akaike Infor- 
mation Criterion) de Akaike o el CRITERIO BIC (Bayesian Information Criterion) de Schwartz. Ambos 
criterios constan de dos términos: uno mide la bondad de ajuste (desvianza residual, D) y el otro pe- 
naliza el valor del ajuste en función de la complejidad del modelo. Estos criterios se interpretan con el 
formato de mejor cuanto más pequeño, y se definen (Burnham y Anderson, 2002) mediante 


AIC 
BIC 


D+2q (1.10) 
D+qlog(N) (1.11) 


donde D es la desvianza residual del modelo, log(N) el logaritmo natural del número de casos u ob- 
servaciones y q es el número de parámetros empleado por el modelo. En general, dados dos modelos 
bien ajustados, suele ser mejor aquel que tiene el más bajo índice BIC o ATC. Aunque su aplicación no 
requiere que los modelos sean anidados, es importante recalcar que estos criterios son sólo aproxima- 
ciones y no deben nunca emplearse en lugar de la prueba formal de ajuste condicional, que es la que 
permite la decisión en última instancia. 
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1.2.3. Tercera etapa: evaluación 


En la tercera etapa del proceso, y una vez aceptado un modelo como mejor representación de los 
datos observados, debe decidirse si tal modelo es válido practicando una evaluación concienzuda de 
sus propiedades. Los modelos derivados del LM plantean ciertas condiciones sobre la estructura de los 
datos, los denominados SUPUESTOS DE LA ESTRUCTURA LM, que con bastante frecuencia no se cumplen 
en la práctica. 


1. NORMALIDAD de la distribución de la variable de respuesta. 


2. HOMOCEDASTICIDAD, HOMOGENEIDAD DE LAS VARIANZAS O VARIANZA CONSTANTE de la variable 
de respuesta para cada uno de los valores del/los predictor/es. 


3. INDEPENDENCIA de las observaciones de la variable de respuesta. 
4. LINEALIDAD, o relación lineal entre variable de respuesta y cada una de las variables explicativas. 


Existen muchos procedimientos estadísticos y gráficos para evaluar el cumplimiento de los supues- 
tos. Sin embargo, resulta también interesante conocer las razones que han podido provocar tales pro- 
blemas. Por lo general suelen ser errores que tuvieron lugar durante el proceso de recogida de datos o 
durante el proceso de especificación de modelos. Los más comunes son los siguientes: 


— ERROR DE MEDIDA en la variable de respuesta y/o en las variables explicativas. Las medidas con 
baja fiabilidad son más propensas a presentar este tipo de error. 


— ERROR DE ESPECIFICACIÓN, que ocurre cuando se especifica un modelo que incumple alguno de 
los supuestos que debe satisfacer. La consecuencia directa del error de especificación es alguna 
forma de SESGO, que por lo general produce una sobreestimación o subestimación de la relación 
entre variables. El error de especificación puede tomar varias formas posibles dependiendo de 
que sea afectado el componente sistemático, el componente aleatorio o la función de enlace del 
modelo o se registren observaciones extremas. 


+ El ERROR DE ESPECIFICACIÓN DEL COMPONENTE SISTEMÁTICO suele presentarse cuando: 
x se utiliza una forma funcional inapropiada para la relación entre variables explicativas 
y respuesta; 
* se omite alguna variable explicativa importante; 
x se incluye alguna variable explicativa irrelevante; 
* se selecciona un rango inapropiado de valores para la/s variable/s explicativas. 
+ El ERROR DE ESPECIFICACIÓN DEL COMPONENTE ALEATORIO ocurre con frecuencia cuando se 
asume una distribución incorrecta para la variable de respuesta. 
+ El ERROR DE ESPECIFICACIÓN DE LA FUNCIÓN DE ENLACE ocurre con modelos GLM y GLMM 
cuando se selecciona una función de enlace inadecuada para transformar los valores del 
predictor lineal en valores ajustados. 


— La presencia de OBSERVACIONES EXTREMAS ocurre cuando se registran OBSERVACIONES ATÍPICAS 
(outliers), o sea, puntuaciones que se desvían de la nube de puntos del diagrama de dispersión 
pero no tienen influencia en el ajuste, y/u OBSERVACIONES INFLUYENTES (influentials), que son 
puntuaciones atípicas que producen cambios drásticos en la estimación de los parámetros y tie- 
nen una influencia determinante en el ajuste del modelo. 
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Afortunadamente existen sofisticados procedimientos para detectar y corregir la mayoría de estos 
errores. Algunos de ellos pueden corregirse de forma simple mediante alguna transformación directa de 
la variable de respuesta. La familia de transformaciones Box-Cox permite seleccionar una transforma- 
ción apropiada para corregir violaciones de la normalidad y de la homogeneidad de las varianzas. En el 
caso de que se viole uno o más de los supuestos anteriores y no sea posible ninguna transformación, los 
PROCEDIMIENTOS NO PARAMÉTRICOS O DE DISTRIBUCIÓN LIBRE pueden ser una alternativa interesante 
(véase Corder y Foreman, 2009 ó Nussbaum, 2015). 


1.2.4. Cuarta etapa: interpretación 


Finalmente, si el modelo no presenta problemas que recomienden su rechazo, en la cuarta etapa del 
proceso el investigador puede interpretar el modelo, comprobando previamente que cumple con los 
tres criterios básicos que articulan todo el proceso de modelado, a saber: 


— El criterio lógico es la PARSIMONIA: el modelo aceptado debe ser suficientemente simple para des- 
cribir con relativa aproximación el complejo mecanismo subyacente que produjo la respuesta. 
Los modelos simples aportan además la ventaja de que tienen un mayor grado de falsabilidad. 


— El criterio estadístico es la BONDAD DE AJUSTE: para que resulte óptimo, el modelo aceptado debe 
diferir significativamente del modelo nulo (modelos LM) o no desviarse demasiado del modelo 
saturado (modelos GLM) y no debe haber ningún otro modelo más apropiado con igual, o menor, 
número de parámetros (ajuste condicional). 


— El criterio sustantivo es la INTEGRACIÓN TEÓRICA: el modelo aceptado debe tener significado des- 
de el punto de vista de la teoría que lo generó y ser fácilmente integrable en su red conceptual. 


Finalmente queda a juicio del investigador la adopción de alguna de tres decisiones posibles: 


— Si el ajuste no es adecuado, o en su evaluación se detectan problemas importantes, el investigador 
debería rechazarlo definitivamente y retornar al comienzo del proceso en busca de un modelo 
más conveniente. 


— Si el ajuste es apropiado, pero el modelo es complejo, lo acepta temporalmente y retorna al co- 
mienzo del proceso en busca de un modelo más parsimonioso. 


— Si el ajuste es apropiado, y el modelo es parsimonioso, lo acepta de forma tentativa y lo interpreta 
e integra con la teoría sustantiva desde la que se generó. 


En contraposición con el enfoque clásico del contraste de hipótesis, que considera solamente la 
aceptación o el rechazo de una determinada hipótesis nula, el enfoque de la comparación de modelos 
proporciona en su lugar el VALOR DE PROBABILIDAD asociado con la hipótesis, es decir, la probabilidad 
de observar un valor tan extremo o más extremo en la dirección del rechazo como el valor observado. 
Este valor de probabilidad puede también conceptualizarse como el nivel en el que la hipótesis sería 
rechazada y, por tanto, nos permite aplicar los criterios anteriormente citados proporcionando más in- 
formación que el simple rechazo o aceptación de una hipótesis. 
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1.3. EJEMPLOS DE MODELADO ESTADÍSTICO 


Para ilustrar el enfoque del modelado estadístico, y particularmente el proceso de ajuste, con alguno 
de los modelos más representativos tratados en este texto, el cuadro 1.2 presenta los datos empíricos 
correspondientes a una muestra de 20 jubilados (en adelante, Ejemplo 1.1) en los que se pretende de- 
terminar si las puntuaciones en un subtest de WAIS (que denotaremos como wais o variable X, con 
valores X;) pueden servir para predecir ciertos comportamientos de interés, que se toman como va- 
riable de respuesta (variable Y, con valores Y;). Utilizamos tres variables de respuesta diferentes para 
ejemplificar los modelos: el deterioro cognitivo (dcog o variable Y1, con valores Y;¡), la presencia o no 
de síntomas seniles (ssen o variable Y2, con valores Y;2) y el número de errores cometido en una tarea 
cognitiva (nerr o variable Y3, con valores Y;3). 


CUADRO 1.2 
Datos empíricos del ejemplo 1.1 
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— La variable dcog (Y 1) es una variable numérica que se distribuye de forma aproximadamente nor- 
mal (con valores que se mueven libremente en el rango -co/+oo y por tanto pueden ser positivos 
o negativos). Para esta variable utilizaremos un MODELO DE REGRESIÓN LINEAL. 


— La variable ssen (Y 2) es una variable binaria o dicotómica que sigue una distribución binomial 
(solamente puede tomar valores 0-1), para la cual emplearemos un MODELO DE REGRESIÓN LO- 
GÍSTICA. 


— La variable nerr (Y 3) es una variable de recuento que sigue una distribución de Poisson (con valo- 
res en el rango 0/+00, y por tanto todos los valores son positivos). Para esta variable emplearemos 
un MODELO DE REGRESIÓN DE POISSON. 
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1.3.1. Modelo de regresión lineal 


Tlustramos en primer lugar el proceso de ajuste especificando un MODELO DE REGRESIÓN LINEAL, un 
modelo de la estructura LM. Como variable de respuesta empleamos la variable dcog, que asumimos 
que se distribuye normalmente, y como predictor la variable wais. 

La salida 1.1 presenta los estimadores por mínimos cuadrados ordinarios del modelo de regresión 
lineal resultante. La ECUACIÓN PREDICTIVA representa los estimadores de los parámetros en forma de 
ecuación: (1; = 2.209 +0.370X;, donde fo = 2.209 es la CONSTANTE O INTERCEPCIÓN, que se define como 
el valor de dcog cuando wais= 0, y Br = 0.370 es la PENDIENTE de la recta de regresión que se representa, 
junto con las bandas de confianza del 95%, en la figura 1.3. 


SALIDA 1.1 
Estimadores de los parámetros del modelo de regresión lineal 
Variable dependiente: dcog 
Límites IC 95% 
Parámetro | B | típico | t | P>|t| | Inferior | Superior 
Intersección | 2.209 1.560 Ñ -0.767 5.184 


wais 0.370 3.075 Ñ 0.117 0.623 


1 1 1 1 
7.5 10.0 12.5 15.0 17.5 


Figura 1.3. — Bandas de confianza del 95% en torno a la función de regresión lineal. 
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El cuadro 1.3 resume de forma detallada, además de los vectores del predictor y de la respuesta, el 
vector de la media (o sea, el valor de la respuesta cuando el predictor es igual a cero), el vector de valores 
estimados y las tres fuentes de variación de la ecuación general del modelado: SC7 = SCyr +SCr. El 
proceso de cálculo para cada fuente de variación se detalla en la parte final del cuadro 1.3. 


CUADRO 1.3 
Detalle del proceso de ajuste del modelo de regresión lineal clásico 


Observado Media | Estimado Fuentes de variación Grados de 
f fi; (BD | (4-0 | (Y,- fp) | libertad 
6.45 5.54 2.45 0.91 -1.54 
6.45 6.28 0.45 0.17 0.28 
6.45 6.65 0.45 0.20 0.65 
6.45 D¿17 -1.45 -1.28 0.17 
6.45 5,91 0.45 0.54 0.09 
6.45 4.80 3.45 -1.65 -1.80 
6.45 5.54 0.45 0.91 0.46 
6.45 6.28 0.55 =0.17 0.72 
6.45 5.91 -1.45 0.54 0.91 
6.45 5.17 0.45 -1.28 0.83 
6.45 7.39 -1.45 0.94 2.39 
6.45 5:91 0.45 0.54 0.09 
6.45 6.28 0.55 0.17 0.72 
6.45 8.14 2.55 1.69 0.86 
6.45 6.65 1.55 0.20 1.35 
6.45 8.51 0.45 2.06 2.51 
6.45 7.39 3.55 0.94 2.61 
6.45 7.76 0.55 1.31 0.76 
6.45 7.02 1.55 0.57 0.98 
20 6.45 6.65 2.55 0.20 2.35 
[1]: SC media 832.050 
[2]: SC v. observados 889.000 
[8]: SC v. estimados 851.663 
SC Total: [2] — [1] 
SC Modelo: [3] — [1] 
SC Residual [2] — [3] 
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La salida 1.2 muestra la descomposición de la variación del modelo de regresión lineal con el pre- 
dictor wais para explicar la variable de respuesta dcog, que define la variación total a explicar (SC Total 
= 56.950) y asigna una parte al componente explicado (SC Modelo= 19.613) y el resto al componente 
no explicado (SC Residual= 37.337). El único componente con el que se ha especificado el modelo se 
representa también en la salida y aporta la misma información que el modelo. El contraste de hipótesis 
con la razón F del ANOVA permite concluir que el modelo (o similarmente, el predictor wais) es estadís- 
ticamente significativo, y por tanto difiere del modelo nulo: F(1,18) = 9.455; P = .007. Recuérdese que 
F es una razón entre medias cuadráticas: F = 19.613/2.074 = 9.455. Y puesto que R? = SCy/SCr, una 
prueba F equivalente para valorar el ajuste global relativo utiliza el coeficiente de determinación R? pa- 
ra indagar si R? difiere significativamente de cero. En consecuencia, el ajuste global relativo del modelo 
de regresión lineal se considera aceptable. 
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SALIDA 1.2 
Análisis de varianza del modelo de regresión lineal 


Variable dependiente: dcog 

Fuentes | SC tipo III MC 

Modelo 19.613 19.613 
wais 19.613 19.613 


Residual 37.337 2.074 
Total 56.950 (2.997) 
4 R cuadrado = 0.344, R cuadrado ajustado = 0.308 


Cuando hay varios modelos bien ajustados, el ajuste condicional compara dos o más modelos para 
determinar cuál de ellos es mejor. Puesto que para un modelo con un predictor no hay más que dos 
modelos posibles, el modelo con el predictor wais (modelo ampliado) y el modelo nulo (modelo reduci- 
do), el ajuste condicional con el modelo de regresión lineal proporciona también el mismo contraste de 
hipótesis que se obtuvo con el ajuste global. La salida 1.3 resume no obstante el procedimiento de ajuste 
condicional comparando las SC y los grados de libertad del modelo de regresión lineal y del modelo 
nulo. Observe que el resultado del ajuste condicional es similar al de la salida 1.2 para el ajuste global, es 
decir, F(1, 18) = 9.455; P = .007. Pero en este caso el resultado no se valora solamente en términos de sig- 
nificación estadística, sino que concluye con la selección de uno de los dos modelos que se comparan. 
Puesto que hay diferencias significativas entre los dos modelos, la decisión más prudente es seleccionar 
el modelo ampliado y descartar el modelo reducido. 


SALIDA 1.3 
Ajuste condicional de modelos 


Modelo 1: dcog= 1 (nulo) 
Modelo 2: dcog= 1 + wais (regresión lineal simple) 


1.3.2. Modelo de regresión de Poisson 


Algunos detalles de la salida de modelos de la estructura GLM difieren de los de la estructura LM, 
aunque el concepto del ajuste es el mismo para todos los modelos. Para ilustrar algunas de las dife- 
rencias utilizamos primero un modelo de regresión de Poisson. Como variable de respuesta utilizamos 
ahora nerr (véase cuadro 1.2), una variable de recuento con valores limitados dentro del rango 0/+00 que 
contabiliza el número de errores cometidos por cada uno de los participantes en una tarea cognitiva, y 
como predictor wais. Para esta variable de respuesta no suele servir la distribución normal. La distribu- 
ción de Poisson con enlace logarítmico se adapta bien en casi todos los casos. El modelo resultante es 
por esta razón un MODELO DE REGRESIÓN DE POISSON. 

La salida 1.4 muestra los estimadores de los parámetros del modelo de regresión de Poisson utilizan- 
do máxima verosimilitud (ML). La interpretación de la salida 1.4 es muy similar a la de la salida 1.1 del 
modelo de regresión lineal, aunque observe que se recurre a la distribución normal estándar en lugar de 
la distribución t de Student. La ecuación predictiva es (1; = —1.102+0.134X;, donde u, son los valores 
esperados que se obtienen aplicando la función inversa de la función de enlace: 1; = exp(n;). La cons- 
tante o intercepción (Bo = — 1.102) es, en unidades logarítmicas, el valor de nerr cuando wais es cero. La 
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pendiente de la función de regresión muestra un incremento positivo de $, = 0.134 unidades logarítmi- 
cas en la variable de respuesta por unidad de aumento en el predictor. La figura 1.4 presenta la función 
de regresión resultante con bandas de confianza del 95%, que aparecen sombreadas en gris y demues- 
tran que el intervalo de confianza no es simétrico y que la predicción se deteriora considerablemente 


con valores de wais >14 puntos. 


Estimadores de los parámetros del modelo de regresión de Poisson 


Variable dependiente: nerr 


Parámetro 


Límites IC 95% 


Inferior 


Superior 


Intersección 


walis 


2.673 
0.011 


0.468 
0.257 


nerr 


Figura 1.4. — Bandas de confianza del 95% en torno a la función de regresión de Poisson. 


La salida 1.5 muestra la descomposición de la variación del modelo de regresión de Poisson. Algunos 


aspectos de esta descomposición que conviene detallar son los siguientes: 
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— En primer lugar, observe que lo que se descompone en este modelo no son sumas de cuadrados 
(como sucede en modelos de la estructura LM) sino componentes de la desvianza, por cuya razón 
se utiliza el término ANÁLISIS DE DESVIANZA (en lugar de análisis de varianza), un concepto espe- 
cífico de modelos que utilizan estimación por máxima verosimilitud. Sin embargo, el argumento 
conceptual es similar. La DESVIANZA TOTAL es la desvianza residual del modelo nulo, y representa 
la variación que es objeto de explicación, Dr = 42.820, con 19 grados de libertad. La DESVIANZA 
RESIDUAL es la porción de la desvianza total que no explica el modelo, Dz = 38.318, con 18 grados 
de libertad, y es la desvianza que aporta el proceso de ajuste: Dg = —2LL. La diferencia entre los 
dos es la DESVIANZA DEL MODELO, D y = 42.819-— 38.318 = 4.502, con 19-18 = 1 grados de libertad. 


SALIDA 1.5 
Análisis de desvianza del modelo de regresión de Poisson 
Variable dependiente: nerr 


Fuentes | Desvianza 
Modelo 4.502 


Residual 38.318 
Total 42.820 


— En segundo lugar, el ajuste global absoluto del modelo de regresión de Poisson se valora compa- 
rando su desvianza residual con la desvianza del modelo saturado (o sea, del modelo que tiene 
desvianza y grados de libertad igual a 0). La regla general para considerar un modelo como glo- 
balmente ajustado en este caso es que su desvianza (residual) no difiera mucho de sus grados 
de libertad (residuales). La prueba de la razón de verosimilitud se evalúa con la distribución Nes 
Siendo Dr = 38.318 y gl = 18, la prueba empírica es y?(18) = 38.318; P = 0.004. El ajuste global 
absoluto se considera aceptable cuando el valor de P no sea significativo, y no aceptable cuando 
sea significativo. El resultado obtenido apunta que el ajuste absoluto del modelo de regresión de 
Poisson no es satisfactorio, y sugiere por tanto que los predictores utilizados no son suficientes. 


— En tercer lugar, el ajuste global relativo cuestiona si el modelo propuesto difiere significativamente 
del modelo nulo. Esta valoración es similar a la que hemos tratado para modelos LM, pero se reali- 
za con la prueba de la razón de verosimilitud y la distribución x?. Para ello se emplea la desvianza 
del modelo con sus grados de libertad. En concreto, y?(1) = 4.502; P = .034 apunta que el ajuste 
relativo es aceptable y que el predictor wais es un buen predictor de la variable de respuesta. 


— Finalmente, el ajuste global concierne a un conjunto de predictores. Es necesario comprobar in- 
dividualmente el efecto de cada uno de los predictores. Puesto que no hay más que un predic- 
tor en este ejemplo, este paso es realmente innecesario. Las dos pruebas más comunes para es- 
ta finalidad son la prueba z, que asume una distribución normal y se muestra en la salida 1.4, 
P(z > |2.136/) = .033, y la prueba de Wald, que asume una distribución y? y es esencialmente el 
cuadrado del valor de z de la salida 1.4, con un grado de libertad, 0 = 2.136? = 4.564; P =.033. 
Observe que, aunque no producen exactamente el mismo resultado, con ambas pruebas se puede 
concluir que el predictor wais es un predictor aceptable para explicar la variable de respuesta. 


El ajuste condicional para un modelo con un predictor es también innecesario, porque sólo hay dos 
modelos posibles a valorar (modelo nulo y modelo de regresión de Poisson). El resultado es similar al de 
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la salida 1.5, pero conviene resaltar algunas diferencias respecto de los modelos de la estructura LM, en 
particular la utilización de la distribución y? en lugar de la distribución F. La salida 1.6 muestra el ajuste 
condicional de los dos modelos, permitiendo de nuevo concluir que hay diferencias significativas entre 
los dos y por tanto es mejor el modelo de regresión de Poisson. 


SALIDA 1.6 
Ajuste condicional de modelos 


Modelo 1: nerr=1 
Modelo 2: nerr= 1 + wais 
Modelo 

1 


2 


Aunque es un tema controvertido, es posible también calcular medidas pseudo-R? equivalentes al 
coeficiente de determinación R? de modelos LM como medidas de ajuste global. Una de las más comu- 
nes es R?, propuesta por McFadden (1974), que se obtiene siguiendo la misma lógica que en los modelos 
de la estructura LM con las desvianzas del modelo de regresión de Poisson y la del modelo nulo: 


= —— =1-— (1.12) 


Para el modelo de regresión de Poisson, Ra = 1 - (38.318/42.819) = .105, que explica el 10.5% de la 
desvianza. McFadden recomendó valores Rí, > .25 para aceptar un modelo como globalmente ajustado. 
La interpretación de las medidas Pseddos Romo debe realizarse con un único modelo, sino en el contexto 
de varios modelos anidados, y debe aplicarse con suma precaución. 

El cuadro 1.4 presenta la descomposición de la variación en el modelo de regresión de Poisson. Ob- 
sérvense las diferencias en formato respecto del cuadro 1.3, en consonancia con las diferencias que se 
comentaron anteriormente para la salida 1.6. Para interpretarlo adecuadamente, conviene tener pre- 
sente algunas precisiones: 


— En primer lugar, mientras que la variable de respuesta nerr sólo puede tomar valores dentro del 
rango 0/ +00, el predictor lineal presenta algunos valores negativos. Es preciso hacer uso de la 
inversa de la función de enlace, 1; = exp(n;), para transformar los valores del predictor lineal en 
valores estimados. Así, utilizando la función de enlace inversa para el primer caso se obtiene el va- 
lor ajustado uy = exp(0.105) = 1.111. Nótese que la columna de los valores estimados no presenta 
ningún valor fuera de rango, o sea, ningún valor inferior a cero. 


— En segundo lugar, la descomposición de la variación se establece siempre tomando como mo- 
delo de partida el modelo nulo, cuya desvianza (la desvianza total, D7 = 42.820) se divide en un 
componente explicado por el modelo (la desvianza del modelo de regresión de Poisson simple, 
Dy = 4.502) y otro componente no explicado (la desvianza residual, Da = 38.318). 


— En tercer lugar, es importante comprobar que en este caso el componente residual no es exacta- 
mente la diferencia entre valores observados y valores estimados por el modelo. En los modelos 
de la estructura GLM pueden emplearse varios tipos de residuales. El que se utiliza aquí es un 
tipo de residual, denominado RESIDUAL DE DESVIANZA, que tiene una función similar al residual 
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clásico, pero no se define como la diferencia entre valores observados y valores estimados, sino 
que se utiliza una función más compleja (véase Olsson, 2002). 


CUADRO 1.4 
Detalle del proceso de ajuste del modelo de regresión de Poisson 


Predictor 
lineal 


Valores 
estimados 


Residual de | Grados de 
desvianza libertad 


o 


0.105 
0.374 
0.508 
0.029 
0.240 
0.162 
0.105 
0.374 
0.240 
0.029 
0.776 
0.240 
0.374 
1.045 
0.508 
1.179 
0.776 
0.911 
0.642 
0.508 
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1.111 
1.453 
1.662 
0.972 
1.271 
0.850 
1.111 
1.453 
1.271 
0.972 
2.173 
1.271 
1.453 
2.842 
1.662 
3.251 
2.173 
2.486 
1.901 
1.662 


1.491 
0.399 
-1.823 
1.394 
0.596 
1.304 
0.107 
1.120 
2.498 
1.394 
0.119 
1.594 
0.399 
-2.384 
-1.823 
0.747 
1.108 
0.882 
0.735 
2.083 


Eh 
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Desvianza total 
Desvianza residual 
Desvianza modelo 


1.3.3. Modelo de regresión logística 


Rh 
do] 


38.318 


ha 
0 


El modelo de regresión logística es otro modelo de la estructura GLM que presenta sus propias pe- 
culiaridades. La variable de respuesta es ahora una variable binaria (ssen), que evalúa la presencia versus 
ausencia de síntomas seniles. Para esta variable de respuesta no sirve la distribución normal ni la distri- 
bución de Poisson, pero se adapta muy bien la distribución binomial con una de dos funciones de enlace 
muy similares: o bien el enlace logit, o bien el enlace probit. La salida 1.7 presenta los estimadores de los 


parámetros del modelo de regresión logística. 


SALIDA 1.7 
Estimadores de los parámetros del modelo de regresión logística 


Variable dependiente: ssen 
Error 
Parámetro Típico 


Límites IC 95% 
Inferior | Superior 


Intersección 6.816 
wais 0.611 
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La diferencia en los estimadores de los parametros entre los modelos de la estructura GLM y los 
de la estructura LM es que se emplea la distribución normal en lugar de la distribución £ de Student. 
La ecuación predictiva es (1; = —14.497 + 1.302X;, donde la constante o intercepción es, en unidades 
logit, el valor de ssen cuando wais = 0 y la pendiente es el incremento en el logit de ssen por unidad de 
incremento en el predictor wais. La figura 1.5 muestra la función de regresión logística con sus bandas 
de confianza al 95% sombreadas en gris. Nótese el deterioro de la predicción en casi todo el rango de 
valores del predictor. 


1.00- 


ssen 
o 
u 
(>) 
1 


0.25- 


0.00-= 


Figura 1.5. — Bandas de confianza del 95% en torno a la función de regresión logística. 


La salida 1.8 presenta, como la salida 1.5, la descomposición de la desvianza total en dos componen- 
tes: la desvianza no explicada por el modelo y la desvianza explicada por el modelo. La desvianza total 
(o desvianza residual del modelo nulo) es Dr = 27.726, con gly = 19 grados de libertad, y la desvianza 
residual del modelo de regresión logística con el predictor wais es Dg = 12.709, con glp = 18 grados de 
libertad. La desvianza explicada por el modelo es la diferencia Du = Dr — Dp = 15.017, con gly = 1. 
El ajuste global absoluto del modelo compara el modelo de regresión logística con el modelo satura- 
do, utilizando la desvianza residual con sus grados de libertad y la distribución y? para la inferencia. 
En este caso, 12 (18) = 12.709; P = .809 apunta que el modelo ajusta bien, pero para muchos autores (p. 
ej., Agresti, 2013), con modelos de regresión logística el ajuste global absoluto sólo es válido con datos 
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agrupados y los datos que se emplean en este ejemplo son no agrupados. El ajuste global relativo nos 
permite concluir que el modelo de regresión logística difiere del modelo nulo: x?(1) = 15.017; P = .026. 


SALIDA 1.8 
Análisis de desvianza del modelo de regresión logística 


Variable dependiente: ssen 


Fuentes 


Modelo 


Residual 


Total 


Detalle del proceso de ajuste del modelo de regresión logística 


wm 


CUADRO 1.5 


Predictor 
lineal 


Valores 
estimados 


Residual de 
desvianza 


Grados de 
libertad 
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2.854 
0.287 
0.997 
-4.138 
1.570 
5.421 
2.854 
0.287 
-1.570 
-4.138 
3.564 
-1.570 
0.287 
6.131 
0.997 
7.414 
4.847 
4.847 
2.280 
0.997 


0.054 
0.429 
0.730 
0.016 
0.172 
0.004 
0.054 
0.429 
0.172 
0.016 
0.972 
0.172 
0.429 
0.998 
0.730 
0.999 
0.992 
0.992 
0.907 
0.730 


0.330 
-1.061 
-1.631 
0.174 
0.612 
0.091 
0.330 
1.061 
0.612 
0.174 
0.229 
1.881 
1.298 
0.063 
0.784 
0.033 
0.229 
0.120 
0.432 
0.784 
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12.709 
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Como medida relativa de ajuste global, con cierta precaución puede aplicarse también una medida 
pseudo-R?, por ejemplo, el coeficiente R? de McFadden. De la salida 1.8 se toman la desvianza del mode- 
lo nulo y la desvianza del modelo de regresión logística y se aplica: R? = (27.726 12.709)/27.726= 0.542, 
apuntando que más del 54% de la desvianza está explicada por el modelo con el predictor wais. En este 
caso parece que el ajuste global del modelo es aceptable. 


1.3.4. Modelo de regresión multinivel 


Aunque los modelos que consideramos a continuación son bastante más complejos que los modelos 
tratados hasta aquí, dada la relevancia que están alcanzando en la investigación psicológica ilustramos 
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también el proceso de ajuste de modelos simples de la estructura LMM. Los modelos ajustados ante- 
riormente (regresión lineal simple de la estructura LM y regresión de Poisson y regresión logística de 
la estructura GLM) se caracterizan porque sólo tienen un componente de error residual, que es con- 
cretamente la desvianza residual de las salidas 1.2, 1.5 y 1.8. Incorporar otro (u otros) componente/s 
aleatorio/s cambiaría la estructura de los modelos LM y GLM, que asumen un único componente alea- 
torio. En tales casos el proceso de ajuste debe recurrir a estructuras de modelado más complejas como 
las estructuras [MM o GLMM. 

El modelo de regresión lineal simple, que se ajustó anteriormente en la sección 1.2.1, utilizó 20 ju- 
bilados de una muestra más amplia, se propuso para explicar la variable de respuesta dcog en función 
de wais y obtuvo un ajuste global aceptable con F(1,18) = 9.455, P = .007, siendo su ecuación predic- 
tiva Y; = 2.209 + 0.370X;. Sin embargo, el análisis sólo se practicó con una submuestra perteneciente a 
una muestra mayor. Más información sobre la muestra global utilizada revelaría que los 20 sujetos que 
se emplearon en el ajuste del modelo de regresión lineal tenían en común el pertenecer a un rango de 
edad igual o menor de 64 años, donde el deterioro cognitivo se asume leve o moderado. Pero la mues- 
tra total de unidades incluía en realidad 120 jubilados, divididos en 6 submuestras o grupos de 20 en 
función de su edad, de los que sólo se incluyó para ajustar el modelo de regresión lineal la primera sub- 
muestra (grupo 1). Los restantes grupos tenían rangos de edad que oscilaban entre 65 y 67 años (grupo 
2), entre 68 y 70 años (grupo 3), entre 71 y 73 años (grupo 4), entre 74 y 76 años (grupo 5) y más de 76 
años (grupo 6). Se asume que el deterioro cognitivo es también función de los grupos de edad, pero esta 
variable, que puede considerarse aleatoria porque recorre todo el rango de valores de edad que interesa 
a la investigación, no se incluyó en el análisis. 

El investigador podría haber utilizado toda la información de los grupos y haber estimado un mo- 
delo de regresión con la muestra total de 120 sujetos, combinando todos los participantes de todos los 
grupos de edad. El resultado que habría obtenido, F(1,118) = 61.072; P = .000, le habría llevado tam- 
bién a considerar que la subescala del wais es un buen predictor del deterioro cognitivo. La ecuación 
predictiva en este caso sería Y; = 2.919 + 0.440X;, y es muy similar a la obtenida para el grupo 1 (véase 
salida 1.1). Pero este análisis no toma en cuenta la variación debida a los grupos de edad y asume que 
los parámetros de intercepción y pendiente del correspondiente modelo de regresión lineal para cada 
nivel de grupo son iguales. 

Para resolver la duda acerca de si es razonable asumir que los modelos de regresión lineal para cada 
grupo sean iguales, el investigador podría también realizar sendos análisis de regresión lineal simple 
separados con cada una de las submuestras y determinar si los resultados son iguales en el conjunto de 
los casos o si difieren entre grupos. El cuadro 1.6 muestra los resultados obtenidos con los seis análisis 
de regresión lineal simple separados para cada grupo, donde se intuye que las intercepciones aumentan 
considerablemente del primero al último grupo, pero las pendientes son muy similares y significati- 
vas en los cuatro primeros intervalos de edad, y no significativas y sensiblemente menores en los dos 
últimos intervalos. 

La figura 1.6 muestra un gráfico con las rectas de regresión separadas para cada grupo de edad. El 
investigador puede concluir que el resultado del modelo de regresión lineal que se trató en la sección 
1.2.1 sólo es válido para el intervalo de edad al que pertenece la submuestra o grupo de jubilados, pero 
no para la muestra global. Lo que los datos apuntan es que, dependiendo del grupo, el pronóstico de 
deterioro cognitivo a partir de la subescala del wais cambia. Es mejor en los grupos 1 a 4 y peor en los 
grupos 5 y 6. Por tanto, podría tener interés para el investigador tener en cuenta la variable de grupo, lo 
que plantea un nuevo problema. Mientras que en el análisis del modelo de regresión simple, sin tener en 
cuenta la variable de grupo, las unidades en las que se registra la variable de respuesta son jubilados, te- 
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niendo en cuenta la variable de grupo deben definirse dos tipos diferentes de unidades, la que se refiere 
alos jubilados (de cualquiera de los seis grupos) y la que se refiere al grupo en su conjunto. Los jubilados 
se consideran unidades de primer nivel, mientras que los grupos son unidades de segundo nivel. Con 
esta estructura jerárquica, el análisis que se requiere es el ANÁLISIS MULTINIVEL, que se ha desarrollado 
específicamente para el tratamiento de datos agrupados (clustered), emplea estimación por máxima ve- 
rosimilitud y analiza por separado efectos fijos y efectos aleatorios. Y puesto que el modelo define más 
de un efecto aleatorio, pertenece a la estructura del modelo lineal mixto (LMM). El enfoque analítico 
usado con modelos de la estructura LMM es el ENFOQUE MIXTO. 


CUADRO 1.6 
Modelos de regresión separados para cada submuestra 


Intercepción 


Pendiente 
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9.177 
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El primer paso para realizar un análisis multinivel consiste en dividir la variación de la variable de 
respuesta en dos componentes aleatorios: un componente de variación intragrupo que refleja la homo- 
geneidad interna de cada grupo, y un componente de variación intergrupo que refleja la homogeneidad 
entre grupos. Si existiera poca variabilidad intergrupo (p. ej., menor del 5%), el análisis multinivel no 
tendría ningún interés, y en su lugar se podría realizar un análisis de regresión convencional con la 
muestra completa de 120 casos. 

La aplicación de análisis multinivel con la muestra completa de 120 casos requiere en primer lugar 
definir un modelo nulo, que con estructuras LM M es también un modelo que no tiene ninguna variable 
explicativa, pero que tiene q = 3 parámetros (la constante y los dos componentes de variación inter e 
intragrupo) en lugar de uno, como sucede en los modelos LM. La salida 1.9 resume los resultados del 
ajuste del modelo nulo con el enfoque mixto. Observe en primer lugar que el formato de salida es muy 
diferente de los formatos que hemos tratado hasta aquí, y distingue una primera parte informativa re- 
ferente al ajuste del modelo (en particular, la desvianza y el número de parámetros del modelo), una 
segunda parte que contiene los efectos aleatorios del modelo y la correlación intraclase (o sea, la razón 
entre la variación intragrupo y la suma de la variación inter e intragrupo) y una tercera parte que contie- 
ne los efectos fijos del modelo, que en el modelo nulo solamente incluye la intercepción y usualmente 
no es objeto de inferencia. 


SALIDA 1.9 
Ajuste del modelo nulo (modelo 1) con estimación REML 
Estructura de covarianza Loglik Desvianza | N* parámetros (q) AIC BIC 
Componentes de varianza | —290.323 580.646 3 584.646 590.204 
Efectos aleatorios 
Parámetros Estimador E. típico Z Wald P> e C.Intraclase 
Intercepción (edad) 6.944 4.597 1.151 .131 0.517 
Residual 6.493 0.860 7.550 .000 
Efectos fijos 
Fuentes de variación Estimador E. típico Grados libertad t P>|tl 
Intercepción 9.592 1.101 114 8.715 .000 


Los elementos esenciales de la salida del modelo nulo son, en primer lugar, su ajuste global. La des- 
vianza (residual) del modelo nulo, con 6 (total de grupos) — 3 (parámetros utilizados) = 3 grados de 
libertad residuales es D(3) = 580.646, lo que revela que discrepa sensiblemente del modelo saturado y 
por tanto se requiere que el investigador continúe con el modelado de los datos. En segundo lugar, la 
razón entre la variación intergrupos y la variación total (o sea, la correlación intraclase) es $6; = 0.517, 
lo que indica que casi un 51.7% de la variación de la variable de respuesta se debe a diferencias entre 
grupos y que el restante 48.3% es variación residual no explicada. En tercer lugar, en un modelo nulo no 
es usual evaluar la significación del único componente fijo, la constante o intercepción, que se refiere a 
la media de la variable de respuesta ($0 = Y = 9.592). Pero una proporción tan importante de variación 
debida a diferencias entre grupos (más del 50%) justifica ampliamente el empleo del análisis multinivel. 

Una vez definido el modelo nulo, y observando que su ajuste global no es aceptable, el investigador 
puede considerar modelos más complejos. A título ilustrativo, por ejemplo, puede especificar un modelo 
introduciendo como efecto fijo la variable explicativa wais. Es posible ajustar un modelo que contemple 
variación en las intercepciones de las rectas de regresión separadas, o bien variación en las pendientes, 
o ambas (véase figura 1.6). Asumiendo que no habrá diferencias entre las pendientes (o sea, asumiendo 
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que hay una pendiente fija común) puede concentrar su atención en evaluar si las intercepciones difie- 
ren entre grupos. El modelo se denomina modelo con intercepción aleatoria (random intercept model) y 
su ajuste se presenta en la salida 1.10. 


SALIDA 1.10 
Ajuste del modelo de intercepción aleatoria (modelo 2) con estimación REML 
Estructura de covarianza Loglik Desvianza | N* parámetros (q) AIC BIC 
Componentes de varianza | —282.402 564.803 4 568.803 574.344 
Efectos aleatorios 
Parámetros Estimador E. típico Z Wald P> a C.Intraclase 
Intercepción (edad) 3.911 2.714 1.441 .230 0.409 
Residual 5.639 0.750 7.518 .006 
Efectos fijos 
Fuentes de variación Estimador E. típico Grados libertad t P>|tl 
Intercepción 5.714 1.177 17.241 4.856 .000 
wais 0.256 0.055 117.251 4.682 .000 


Las cuestiones esenciales a considerar en esta salida son, en primer lugar, la desvianza del modelo, 
que con 6 (número de casos/grupos) — 4 (número de parámetros usados) = 2 grados de libertad resi- 
duales, es D(2) = 564.803, lo que representa una leve mejora respecto del modelo nulo pero todavía se 
desvía mucho del modelo saturado. En segundo lugar, la correlación intraclase (la razón entre los dos 
efectos aleatorios del modelo, la variación intergrupos y la variación total) es de 0.409, o sea, casi un 41% 
de la variación de la variable de respuesta se debe a variación de nivel 2 entre grupos y el restante 59% 
es variación residual de nivel 1. En tercer lugar, la interpretación de los efectos fijos del modelo se aplica 
al conjunto de los jubilados participantes. Respecto a la constante o intercepción, el deterioro cogni- 
tivo observado cuando wais = 0 es de 5.714 unidades, y respecto a la pendiente, el incremento que se 
produce en deterioro cognitivo por incremento en wais es de $; = 0.256 unidades, un incremento esta- 
dísticamente significativo: t(117.251) = 4.682; P = .000. Observe que los grados de libertad de la prueba 
t no es, como es usual, un número entero (117.251). 

En comparación con el modelo nulo, con la introducción del predictor wais la variación residual de 
nivel 1 (intragrupo) ha descendido de 6.493 a 5.639, una reducción mayor del 13%: (6.493-5.639)/6.493 = 
0.132, lo que apunta que las puntuaciones obtenidas en la subescala del wais por los jubilados explica 
más del 13% de la variabilidad intragrupo. Además, el predictor wais afecta también a la variación de 
nivel 2 (intergrupos), que tiene una reducción de casi un 44%: (6.944 — 3.911)/6.944 = 0.437, lo que su- 
giere que las puntuaciones intragrupo en wais por los jubilados explican un 44% de la variabilidad entre 
grupos en deterioro cognitivo. 

Para dirimir si el modelo con intercepción aleatoria es mejor que el modelo nulo debe utilizarse el 
ajuste condicional de modelos. La salida 1.11 representa el ajuste condicional de dos modelos que difie- 
ren por la inclusión del predictor wais, el primero donde D se refiere a la desvianza residual y q se refiere 
al número total de parámetros empleado en los dos modelos. El ajuste condicional utiliza la prueba de 
la razón de verosimilitud y obtiene un valor de L? = 19.613. El valor de probabilidad de la distribución 
de y? que le corresponde es: y?(1) = 19.613;P < .001. Y puesto que se encuentran diferencias signifi- 
cativas entre ambos modelos, el investigador debe seleccionar el segundo modelo, o sea, modelo con 
intercepción aleatoria, como modelo más apropiado. A la misma conclusión conduce la comparación 
de los criterios de información A/C y BIC entre los dos modelos. 
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SALIDA 1.11 
Ajuste condicional de los modelos nulo (1) y con intercepción aleatoria (2) 
Modelo 1: dcog=1 + (1 | grupo) 
Modelo 2: dcog=1 + wais+ (1 | grupo) 
Modelo 


1 580.646 
2 564.803 


1.4. LAESTRUCTURA DEL MODELO LINEAL CLÁSICO (LM) 


El Modelo Lineal Clásico (LM) es el instrumento analítico básico de la investigación en las Ciencias 
del Comportamiento, que integra procedimientos familiares para el investigador como el análisis de 
regresión, el análisis de varianza (ANOVA), el análisis de covarianza (ANCOVA) y, por generalización, 
muchos procedimientos multivariantes (MANOVA, MANCOVA y Análisis Discriminante, entre otros). 

En su formulación univariante, la ecuación fundamental del LM es 


Pp 
Y, = fo+ Y Xi¡Bj+es (1.13) 
j=1 


donde Y; (i=1,..., N) son N valores de la variable de respuesta, f$p es un parámetro constante para todo 
1, X¡j = (Xj1,..., Xij,.-., Xp) son los valores de p variables explicativas (covariantes y/o factores), cada 
una de las cuales tiene N elementos, y 6; = 6B1,..., Pp es un conjunto de p coeficientes de regresión. En 
esta ecuación, el predictor lineal (7; = fp + A X¡¡ Py) y el valor esperado (1) se miden en la misma 
escala de medida. Nótese que, en esta formulación, los datos son la variable de respuesta (Y;¿), el modelo 
es el vector de valores estimados, que es igual al predictor lineal (1; = 7), y la discrepancia entre datos 
y modelo es el error residual, e; = Y; — 1¡. Desarrollando la ecuación 1.13 para las N observaciones 


Y; X10 X11 dal X1p e1 

Y) Xo0 X>1 de Xop Bo e2 

Y; - Xio Xi ... Xip : úl ei (1419) 
A E a ; Bp 

Yw Xwo Xn1 ¿ns XNp IN 


y escribiendo de forma compacta la ecuación (1.14) con notación matricial, resulta 


Yox1 = Xx Bigxn + ex) (1.15) 
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En esta ecuación, Y es el vector de la variable de respuesta, de orden (WN x 1), donde cada caso corres- 
ponde a una observación, X es la matriz del modelo (o matriz de diseño) conocida, de orden (N x q), 
donde q = p+1 (o sea, el número de parámetros es igual al número de predictores más la constante), 
cuyas filas son casos y cuyas columnas son variables, f es el vector de parámetros desconocidos del 
modelo, de orden (q x 1) y e es el vector de errores residuales, de orden (WN x 1). 

En su formulación multivariante, dadas m medidas diversas de una variable de respuesta (p. ej., 
ítems de un test, medidas repetidas de las mismas unidades experimentales, etc.) o bien m variables de 
respuesta diferentes, la estructura multivariante LM se formula mediante 


Ya Ya .. Yim Xo Xi... Xip 11 €2 ... €m 
Yy Yo .. Ym Xo X21 -. X2p Bi Bn ts Bi €91 9  ... 2% 
: Boo Bor -< P2m : 
Yi Y Yim y Xio X; Xip : : E : A en € lim 
A : y A : |MBpo BpL --- Bpm A : 
Yni Yn2 +... Yum Xno Xnt +... XNp ent €n2 ... EU 


y con notación matricial 


Y nxm) =XwxqB(qxm) + Elvxm) (1.17) 


donde Y es la matriz de medidas de la variable de respuesta, de orden (Nx m), X es la matriz del modelo, 
de orden (NV x q), B es la matriz de parámetros, de orden (q x m), y E es la matriz de errores residuales, 
de orden (N x m). Es importante notar que la matriz X es la misma para las dos formulaciones. 

Las principales características de la estructura LM en su formulación univariante son las siguientes: 


— La naturaleza del vector de la variable respuesta Y es numérica. 


— La naturaleza de la matriz de variables explicativas X es mixta porque puede incluir variables nu- 
méricas y/o variables categóricas. Si todas las variables explicativas son numéricas (sólo predicto- 
res o covariantes), el resultado es un MODELO DE REGRESIÓN. Si todas las variables explicativas son 
categóricas (sólo factores), el resultado es un MODELO ANOVA. Si hay alguna mezcolanza de cova- 
riantes y factores, el resultado es un MODELO ANCOVA. Pero, en cualquier de los casos, la matriz 
del modelo X se considera una matriz de valores fijos que no cambian en posteriores repeticiones 
de la investigación. Como consecuencia, el vector f es un vector de parámetros de efectos fijos. 


— Los valores estimados (11;) y el predictor lineal (7;) se miden en la misma escala de medida, y por 
tanto la función de enlace es la identidad. 


— Los supuestos básicos que deben cumplir los modelos de esta estructura son: 


1. Se asume una distribución normal de la variable de respuesta (supuesto de normalidad). 
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2. Se supone constante la varianza de la variable de respuesta para cada uno de los valores de 
las covariantes y/o factores (supuesto de homocedasticidad). 


3. Las observaciones Y; se registran en diferentes unidades experimentales y por tanto se asu- 
men mutuamente independientes (supuesto de independencia). 


4. Se asume una relación lineal entre variables explicativas y variable de respuesta (supuesto de 
linealidad). 


Muchos modelos estadísticos no presentan graves problemas cuando se viola de forma moderada 
el supuesto de normalidad. Pero todo lo contrario sucede cuando se violan los supuestos de indepen- 
dencia, homocedasticidad o linealidad. La violación de los supuestos de independencia y homocedas- 
ticidad requieren un tratamiento diferenciado. Los modelos de la estructura LMM y el modelo GEE de 
la estructura GLM se han desarrollado precisamente con el objeto de tratar violaciones de estos dos 
supuestos. La violación del supuesto de linealidad representa un error de especificación que requiere 
emplear modelos no lineales (véase Bates y Watts, 2008). 

Una forma compacta de resumir estos supuestos suele presentarse argumentando que los errores 
residuales se distribuyen normal e independientemente con varianza constante, e; - NID(O, oo, donde 
0? es el parámetro de escala que se asume constante para todas las observaciones. Al suponer constante 
la varianza, el interés se concentra en el modelado de las medias de la variable de respuesta utilizando 
los parámetros de efectos fijos f. 


— El procedimiento más común de estimación de los parámetros Pf; de un LM es MÍNIMOS CUADRA- 
DOS ORDINARIOS, y su objetivo empírico es la minimización de la suma cuadrática de los errores 
residuales e; = Y; — ú;, o sea, que » e —> mínimo. 


— La interpretación de los parámetros de un modelo especificado por el investigador se determina 
utilizando la distribución £ de Student, que se comporta aceptablemente incluso con muestras 
pequeñas. 


— El ajuste global absoluto de un modelo especificado por el investigador no puede valorarse. El 
ajuste global relativo se determina comparándolo con el modelo nulo, utilizando para ello la razón 
F de varianzas. 


Dedicamos un tratamiento más detallado de algunos de los modelos de la estructura LM en los ca- 
pítulos 2 a 5. Una excelente exposición del modelo lineal clásico desde la perspectiva de la comparación 
de modelos puede consultarse en el texto de Judd et al. (2008) y en español en el primer volumen del 
texto del Grupo ModEst (2005). 


1.5.  LAESTRUCTURA DEL MODELO LINEAL GENERALIZADO (GLM) 


El GLM es en esencia una reformulación más amplia del LM, al que se han incorporado como casos 
especiales todos los procedimientos del LM para variables de respuesta numéricas (regresión, ANOVA 
y ANCOVA) y procedimientos específicos para variables de respuesta categóricas tales como el análisis 
loglineal, el análisis logit, la regresión logística y la regresión de Poisson. Lo que todos estos modelos 
añadidos tienen en común es el requisito de linealidad y un método común para estimar sus paráme- 
tros, que a diferencia de los modelos LM es MÁXIMA VEROSIMILITUD (ML). 

La ecuación fundamental del GLM es la misma que para el LM. Con notación matricial: 
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Yixv = Xx Bigxn + €mx1) (1.18) 


donde Y son los datos, X6f = y es el modelo y e es el error residual. Hay dos diferencias esenciales entre 
el LM y el GLM: 


— La utilización de una función de enlace diferenciada, para transformar la escala del predictor li- 
neal, donde se realiza la computación estadística, a la escala del valor esperado, donde se calcula 
la discrepancia entre modelo y datos empíricos, 


ni=8(49) did 


— La definición de una función de varianza que captura cómo la varianza de la variable de respuesta 
depende de la media, 


V(Y) =V(u) (1.20) 


donde d es un parámetro de variación constante. 


Teniendo en cuenta que la formulación de modelos GLM incluye los modelos LM como un caso 
particular (donde la función de enlace es la identidad), las características específicas del GLM son las 
siguientes: 


— La naturaleza del vector de la variable de respuesta Y puede ser numérica o categórica. La genera- 
lización del LM al GLM es precisamente la inclusión de variables de respuesta categóricas. 


— La naturaleza de la matriz del modelo X puede ser también variable. Puede contener variables 
explicativas numéricas, categóricas o una mezcolanza de las dos. 


— Valor esperado (1;) y predictor lineal (7;) no se miden en la misma escala, y por tanto se precisa 
de una función de enlace para transformar los valores del predictor lineal en valores estimados. 
La naturaleza de la matriz X y de la función de enlace determinan los procedimientos estadísticos 
que son aplicables. En el cuadro 1.7 se resumen los procedimientos más usuales. 


— La generalización desde el LM al GLM permite supuestos mucho menos restrictivos que los del 
LM. En concreto: 


1. No se asume normal la distribución de la variable de respuesta, porque depende del modelo 
especificado y de la función de enlace utilizada. El GLM puede utilizar cualquier distribución 
de la familia exponencial y no solamente la distribución normal. 


2. No se asume constante la varianza de la variable de respuesta para cada uno de los valores 
de los predictores/covariantes, porque depende también de la distribución y la función de 
enlace. 
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3. El supuesto de linealidad se asume para la escala del predictor lineal, pero no para la escala 
del valor esperado. 


4. El supuesto de independencia, en cambio, es un requisito fundamental para todos los pro- 
cedimientos del GLM. Sin embargo, existe una extensión de la estructura GLM apropiada 
para el análisis de datos que no cumplen el supuesto de independencia (p. ej., datos longi- 
tudinales y jerárquicos). Tal extensión fue originalmente propuesta por Liang y Zeger (1986) 
y Zeger, Liang y Albert (1988). Los modelos típicos de esta extensión de la estructura GLM 
se conocen como modelos GEE (Generalizing Estimating Equations). Más detalles sobre las 
características de los modelos GEE, junto con una aplicación práctica de los mismos, puede 
consultarse en Ghisletta y Spini (2004). 


— Para los procedimientos que generalizan el LM, el método general de estimación de parámetros 
es MÁXIMA VEROSIMILITUD O alguna de sus variantes (p. ej., máxima cuasi-verosimilitud para el 
modelo GE). 


El cuadro 1.7 presenta una clasificación de los principales modelos lineales generalizados (adapta- 
da de Grupo ModEst, 2005b). Los criterios de clasificación que definen las columnas del cuadro 1.7 se 
especifican a continuación (véase también cuadro 1.1): 


— Naturaleza de la variable de respuesta. Varios tipos de variable de respuesta son posibles en un 
GLM: 


+ VARIABLE NUMÉRICA (cuantitativa), que puede adoptar un número infinito de valores positi- 
vos y/o negativos. Se registra para cada unidad de observación. 


+ VARIABLE CATEGÓRICA, una variable que sólo puede adoptar un número limitado de valo- 
res positivos y se mide en escala nominal u ordinal. Se distinguen entre sí en función del 
número de categorías en VARIABLES BINARIAS O DICOTÓMICAS (si solamente tienen dos ca- 
tegorías) y VARIABLES POLITÓMICAS (si tienen más de dos categorías). Este tipo de variables 
puede utilizarse de forma no agrupada (para cada unidad de observación) o bien, si todas 
las variables explicativas son categóricas, de forma agrupada (para conjuntos de unidades 
de observación) y organizadas bajo la forma de tablas de contingencia. 


+ VARIABLE DE RECUENTO, una variable que sólo puede adoptar un número finito de valores 
positivos y representa el número de veces que un evento ocurre. Se registra para cada unidad 
de observación. 


+ VARIABLE DE FRECUENCIA, una variable que puede adoptar un número finito de valores posi- 
tivos, se registra agrupando unidades de observación y se representa bajo la forma de tablas 
de contingencia. 


— Componente sistemático. Se refiere al predictor lineal, que es una función de las variables explica- 
tivas, y su estructura depende de la naturaleza de las variables explicativas, que puede ser numé- 
rica, si todas las variables explicativas tienen naturaleza cuantitativa; categórica, si todas tienen 
naturaleza categórica (nominal u ordinal), o mixta, si en el predictor lineal se combinan variables 
explicativas continuas y categóricas. 


— Componente aleatorio. Hay un componente único, y se refiere a la distribución que se asume para 
el componente de error, que puede ser cualquier miembro de la familia exponencial, siendo las 
más comunes las distribuciones normal, binomial, multinomial y Poisson. 
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— Función de enlace. Se refiere a la función de transformación de predictor lineal a valores estima- 
dos. Las más comunes funciones de enlace de los GLM son: 


+ el ENLACE IDENTIDAD: predictor lineal y valor esperado se expresan en la misma unidad de 
medida; 


+ el ENLACE LOGARÍTMICO: el predictor lineal es el logaritmo del valor esperado, y 


+ el ENLACE LOGIT: el predictor lineal es el logaritmo de una razón de probabilidades (odds) del 
valor esperado. 


CUADRO 1.7 
Principales procedimientos del MLG 


Naturaleza de la Componente Función de 
variable respuesta (rango) | sistemático | aleatorio enlace Modelo aplicable 
numérica cuantitativa numérica Normal identidad Regresión lineal/GEE 
(=00/ +00) categórica Normal identidad ANOVA 

mixta Normal identidad ANCOVA 


categórica binaria (0/1) 
* no agrupada mixta Binomial(1) | logit Regresión logística/GEE 
* agrupada categórica Binomial(m) | logit Análisis logit 
categórica politómica (0/n) 
* no agrupada mixta Multinomial | logit Regresión logística/GEE 
* agrupada categórica Multinomial | logit Análisis logit 


recuento (0/ +00) mixta Poisson logarítmica | Regresión de Poisson/GEE 


frecuencia (0/100) categórica Poisson logarítmica | Análisis loglineal 


1.6. LA ESTRUCTURA DEL MODELO LINEAL MIXTO (LMM) 


Todos los modelos incluidos en la estructura GLM contienen sólo un componente aleatorio, repre- 
sentado por los errores residuales e;, que se distribuyen con varianza constante según e; - NID(O, 0). 
Los supuestos de homocedasticidad e independencia son en particular requisitos altamente restricti- 
vos que hacen inaplicable los modelos de la estructura GLM (con la excepción del modelo GEE, como 
tratamos más arriba) en muchas situaciones de investigación comunes en psicología, sobre todo en es- 
tudios longitudinales y en estudios multinivel que implican diferentes niveles de agregación (clustered 
data). 

La estructura del Modelo Lineal Mixto (LM M) es una extensión de la estructura LM propuesta por 
Laird y Ware (1982) que se formula, respecto de la ecuación 1.15, mediante 


Yin =X ax Braxo) + Zin Urxi) + €(vx1) (1.21) 


donde f es un vector de efectos fijos, u es un vector de efectos aleatorios, X es una matriz de efectos fijos 
constantes del modelo y Z es una matriz de efectos aleatorios, que es en general un subconjunto de la 
matriz de efectos fijos, ya que £ < q. Los errores aleatorios se distribuyen según e; - N(0,0?), aunque ya 
no se requiere que la varianza 0? sea constante u homocedástica, y los efectos aleatorios se distribuyen 


también de forma normal con u; - N(0,G), siendo G la matriz de covarianza de los efectos aleatorios. En 
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consecuencia, la extensión que la estructura LMM supone respecto de la estructura LM es simplemente 
la inclusión de más efectos aleatorios en el modelo. Por lo demás, Y es el vector que representa los datos 
empíricos, Xf + Zu = y = q es el predictor lineal (que incluye los efectos fijos y efectos aleatorios del 
modelo) y e es el error residual, que representa la discrepancia entre datos empíricos y modelo. 

Esta estructura es especialmente idónea para modelar situaciones de investigación donde la varian- 
za no es constante y/o las observaciones no son independientes, aunque se asume con cierta flexibili- 
dad que son poblaciones normales. Situaciones donde se utilizan como unidades experimentales indi- 
viduos que participan de características comunes (p. ej., miembros de una misma familia al investigar 
la interacción diádica madre-hijo), observaciones jerárquicamente dependientes (p. ej., sujetos dentro 
de aulas, aulas dentro de colegios y colegios dentro de distritos escolares) o en general estudios longi- 
tudinales en los que se registran medidas repetidas de los mismos sujetos en diferentes momentos en 
el tiempo, son aplicaciones potenciales de los modelos de la estructura LMM (Hedeker, 2005). Muchas 
investigaciones de la psicología aplicada utilizan alguna de estas situaciones. 

Sin embargo, el procedimiento de estimación de los parámetros f y u no puede ser el procedimiento 
utilizado en la estructura LM, o sea, mínimos cuadrados ordinarios. En su lugar es preciso emplear al- 
guna forma de estimación por máxima verosimilitud, cuya complejidad hace inviable que pueda prac- 
ticarse con una sencilla calculadora de escritorio, como sería posible con la estimación por mínimos 
cuadrados ordinarios. Afortunadamente, los paquetes estadísticos profesionales han introducido entre 
sus programas la estimación de este tipo de modelos, por lo que en los capítulos que utilizan modelos 
LMM nos centraremos en la interpretación y pasaremos por alto los detalles computacionales. 


1.7. LA ESTRUCTURA DEL MODELO DE ECUACIONES ESTRUCTU- 
RALES (SEM) 


La ecuación general del modelado: DATOS = MODELO + ERROR (ecuación 1.1) requiere una ecua- 
ción única, mediante la cual se define una variable dependiente (los DATOS) y se especifica un MODELO 
compuesto de un conjunto de variables independientes junto con sus correspondientes parámetros. 

Muchas situaciones de investigación requieren emplear un sistema de ecuaciones para capturar de 
forma más precisa las relaciones entre las variables y para profundizar en su estructura causal. Usual- 
mente tal sistema de ecuaciones se representa mediante un diagrama donde todas las variables (que 
se representan con rectángulos) se conectan con flechas o rutas (paths) con otras. Las variables que no 
reciben ninguna flecha se denominan en este contexto variables exógenas y las que reciben flechas de 
otras variables se denominan variables endógenas. Los errores del modelo se representan con círculos. 
El modelo explicativo que se representa en un diagrama se denomina MODELO ESTRUCTURAL O MODE- 
LO PATH (path model). El análisis que se practica en estos casos se conoce como ANÁLISIS DE RUTAS O 
ANÁLISIS PATH path analysis) y requiere definir un sistema de ecuaciones de regresión que refleje las re- 
laciones entre las variables manifiestas. Más detalles sobre los componentes de un modelo estructural 
y el análisis path pueden consultarse a un nivel introductorio en Pedhazur (1997) y Lei y Wu (2007). 

Un ejemplo de modelo path se representa en la figura 13.7 (capítulo 13), y muestra las relaciones 
entre cuatro variables observables, de las que una es exógena (estresor conglomerado) y las otras tres son 
endógenas (apoyos, sentido de la coherencia y nivel de estrés). 

Un modelo path es por tanto una generalización de los modelos de regresión de la estructura GLM 
(fundamentalmente, regresión normal, regresión logística y regresión de Poisson) y solamente utilizan 
VARIABLES MANIFIESTAS U OBSERVABLES, cada una de las cuales se encierra en un rectángulo en el diagra- 
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ma path. Pero también es posible emplear VARIABLES LATENTES NO OBSERVABLES, que son constructos 
que se definen a partir de un conjunto de variables manifiestas (también llamadas en este contexto 
indicadores). Para distinguirlos de las variables manifiestas suelen representarse con círculos en un dia- 
grama path. Se denomina MODELO DE MEDIDA a la representación de las variables latentes en función 
de un conjunto de variables manifiestas o indicadores. 

Los modelos SEM (Structural Equation Model) se definen en este contexto como la combinación 
particular de un modelo de medida y un modelo estructural. Un ejemplo de modelo SEM se representa 
en la figura 13.8 (capítulo 13) y consta de un modelo estructural que expresa las relaciones entre cuatro 
constructos o variables latentes (los círculos del diagrama), cada uno de los cuales se definen con un 
conjunto de indicadores, donde violencia se formaliza con los indicadores física”, 'psicológica' y 'sexual' 
(expresados con rectángulos en el diagrama), estrés postraumático con los indicadores "estrésl” y 'es- 
trés2”, y desconexión y rechazo con los indicadores 'rechazo1” y 'rechazo2' y autonomía deteriorada con 
los indicadores *autonomíal' y 'autonomía2.. 

El proceso de ajuste de un modelo SEM se realiza de forma similar a los modelos tratados anterior- 
mente, aunque tiene sus propias peculiaridades. Básicamente, con las correlaciones entre las variables 
(los DATOS) se obtiene una matriz de covarianza muestral. A partir de esta matriz y del modelo SEM 
propuesto para explicar los datos empíricos se calcula una matriz de covarianza estimada por el mode- 
lo. Si la matriz de covarianza estimada no se desvía sensiblemente de la matriz de covarianza muestral 
el modelo se ajustará aceptablemente; en caso contrario, el modelo no se ajustará. El ajuste global se 
practica, como es usual, con la prueba de la razón de verosimilitud 1?, distribuida según y?, aunque se 
acompaña también de otros indicadores de ajuste alternativos para capturar la desviación del modelo 
propuesto respecto de los datos empíricos que se propone explicar. La prueba de la razón de verosi- 
militud no resultó significativa ni en el modelo path de la Figura 13.7, EY) = 0.114;P = .74, ni en el 
modelo SEM de la figura 13.8, q? (21) = 31.62; P = .06, y por tanto se asume un ajuste global absoluto 
satisfactorio. 


1.8. SUGERENCIAS DE ESTUDIO 


Asumimos en el lector una información básica sobre Estadística Descriptiva e Inferencial. Los textos 
de Botella, Suero y Ximénez (2012), Howell (2013), Agresti y Franklin (2013) o preferentemente Kaplan 
(2011) pueden servir para consolidar tal información. 

La filosofía general y la historia del modelado estadístico y el proceso de revolución silenciosa contra 
el NAST puede leerse en un trabajo de Rodgers (2010). Claves en esta historia han sido las monografías 
de Judd et al. (2008), Maxwell y Delaney (2004) y Kaplan (2011). Un texto moderno sobre el modela- 
do y las estructuras que incluye es el de Tarling (2009). En español pueden consultarse dos asequibles 
monografías del Grupo ModEst (2005a, 2005b). 

Para los modelos de la estructura LM hay una ingente cantidad de referencias con orientación psi- 
cológica, la mayoría especializadas en modelos de regresión, modelos ANOVA y modelos ANCOVA que 
trataremos con más detalle en los próximos capítulos. 

Una auténtica revolución estadística produjo en la década de los 70 del siglo pasado la formulación 
del MODELO LINEAL GENERALIZADO (estructura GLM) propuesta por Nelder y Wedderburn (1972). La 
"biblia" de los modelos lineales generalizados es el texto de McCullagh y Nelder (1989). Textos más in- 
troductorios son Collett (2002), Dobson y Barnett (2002), Hutcheson y Sofroniou (1999) y Olsson (2008). 
Más completo es el texto de Myers, Montgomery, Vining y Robinson (2010), aunque los ejemplos son 
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ajenos a la Psicología. Una introducción básica en español se ofrece en el segundo volumen del Grupo 
ModEst (2005b). 

Introducciones asequibles a los MODELOS GEE de la estructura GLM son Ballinger (2004) y Ghisletta 
y Spini (2004). Pueden encontrarse algunas aplicaciones con este tipo de modelos en la investigación 
psicológica, particularmente en Psicología del desarrollo. 

Todavía no son muy abundantes las referencias existentes sobre los MODELOS LINEALES MIXTOS (es- 
tructuras LMM y GLMM,), y casi todas ellas se asocian a algún (o algunos) programa/s de software. 
Además del trabajo clásico de Laird y Ware (1982), son especialmente recomendables el texto de Pin- 
heiro y Bates (2000) para S y R, el de Littell, Milliken, Stroup, Wolfinger y Shabenberger (2006) para el 
programa SAS, el de Heck, Thomas y Tabata (2010) para SPSS, y los dos volúmenes de Rabe-Hesketh y 
Skrondal (2012a,b) para STATA. Todos los programas estadísticos que ajustan modelos LMM se tratan 
brevemente en West y Galecki (2011) y con mayor profundidad en West, Welch y Galecki (2015). 

Más abundantes son las referencias sobre los modelos de la estructura SEM, que hoy por hoy son 
los más demandados. Una de las referencias más recomendadas sobre algunos de los modelos más 
comunes empleados en la literatura psicológica que incluye esta estructura es el texto de Kline (2011). 
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2.1. INTRODUCCIÓN 


Los modelos estadísticos caracterizados por una distribución normal para la variable de respuesta, 
que se asume de naturaleza numérica, y la función identidad como función de enlace entre predictor 
lineal 7; y valor esperado ;, configuran una familia de modelos con estructura LM (Hutcheson y Sofro- 
niou, 1999; Kutner, Nachtsheim, Neter y Li, 2005). Se han distinguido tres grandes procedimientos en la 
familia de modelos con estructura LM, que difieren según sea la naturaleza de las variables explicativas 
que incluye: 


— en los MODELOS DE REGRESIÓN se utiliza un conjunto de variables explicativas de naturaleza nu- 
mérica (predictores o covariantes); 


— en los MODELOS DE ANÁLISIS DE VARIANZA (ANOVA) se utiliza un conjunto de variables explicati- 
vas de naturaleza categórica (factores), que representan la pertenencia a grupos, cada una de las 
cuales debe ser codificada para convertir sus categorías en vectores numéricos apropiados; 


— en los MODELOS DE ANÁLISIS DE COVARIANZA (ANCOVA), O MODELOS CON VARIABLES CONCOMI- 
TANTES, se emplea una combinación de variables explicativas numéricas y categóricas, covarian- 
tes y factores. 


En este capítulo tratamos los modelos de regresión con el Ejemplo 2.1 para ilustrar los procedimien- 
tos. Los modelos de regresión se distinguen entre sí por el número de variables explicativas que contie- 
nen. Los posibles modelos a especificar son el MODELO NULO (ninguna variable explicativa), el MODELO 
DE REGRESIÓN SIMPLE (una variable explicativa) o el MODELO DE REGRESIÓN MÚLTIPLE (más de una va- 
riable explicativa). 


2.2. EJEMPLO 2.1 


En el marco de una investigación empírica sobre procesos de lectura se registraron medidas de una 
numerosa muestra de individuos del primer ciclo de EGB de colegios situados en la zona urbana de una 
capital de provincia. Los datos del ejemplo representan un reducido subconjunto de la muestra original. 
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El objetivo de la investigación pretendía conocer qué variables relevantes podrían explicar el nivel de 
comprensión verbal de los niños. Los datos empíricos del Ejemplo 2.1 se representan en el cuadro 2.1 
bajo la forma de una matriz de observaciones (filas) por variables (columnas). 


CUADRO 2.1 
Datos empíricos del Ejemplo 2.1 


voca inte adap auto sexo  nsoc comp 
28 43 15 a 29 
30 29 19 
22 33 26 
27 30 30 
24 19 
16 15 
23 23 
20 25 
14 18 
14 26 
14 22 
18 22 
15 20 
20 
28 
20 
19 
13 
18 
17 
12 
24 
11 
14 
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10) 
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Supongamos que el modelo máximo que acapara la atención del investigador incluyera como varia- 
ble de respuesta comp, que es una prueba numérica de comprensión de textos, y como posibles varia- 
bles explicativas las siguientes: 


— voca (X¡), una prueba numérica de vocabulario para niños de 6 a 9 años; 

— inte (X>), una prueba numérica de inteligencia global; 

— adap (X3), una medida numérica de adaptación escolar; 

— auto (X4), una medida numérica de autoestima; 

— sexo (A), una variable categórica donde *v” representa a los varones y 'm' a las mujeres; 


— nsoc (B), una variable categórica que clasifica a los niños en función del nivel socioeconómico de 
sus familias, donde 'a' se refiere a nivel socioeconómico por encima de la media, 'b' niños con un 
nivel socioeconómico intermedio y 'c' niños con nivel socioeconómico por debajo de la media. 
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La salida 2.1 presenta, para cada una de las variables, los estadísticos descriptivos básicos necesa- 
rios para desarrollar todos los cálculos requeridos y tiene dos partes. En las seis primeras columnas se 
representan, para cada variable, varios valores descriptivos de interés. Para la variable Y, por ejemplo, 
se representan el tamaño muestral (N), la suma bruta (. Y), la suma cuadrática bruta (SCB) de los va- 
lores observados (Y Y?), la media (Y) y la varianza (Sd Las cuatro columnas siguientes representan la 
MATRIZ DE SUMAS DE CUADRADOS (SC) Y PRODUCTOS CRUZADOS (SP), una matriz cuadrada y simétrica 
que es el resultado de corregir las sumas cuadráticas brutas de cada variable respecto del cuadrado de 
su media y las sumas de productos de dos variables respecto del producto de sus respectivas medias. 
Así, la SC para la variable X se obtendría utilizando 


2 
2r = Y X?-NX (2.1) 


SCx=)Xx?- 


donde 0 X92/N = NX es una cantidad básica que llamamos CORRECCIÓN DE LA MEDIA. Por ejemplo, 
para la variable X, (voca), siendo la suma cuadrática bruta (no corregida) de los valores observados 
E XÍ=28%+30%++-- +8? +8% = 7362 y la corrección de la media (2 X1)?/N = (388)?/24 = 6272.667, la 
SC (corregida) de X¡ es la diferencia: SCx] = 7362 — 6272.667 = 1089.333 y se representa en la primera 
fila/columna de la matriz de SC y SP. Para la variable Y (comp), siendo Y y?2=292+192+-..+82+9?*= 
6593 y OQ Y /N = (349)2/24 =5075.042, la SC (corregida) de Y es la diferencia: SCy = 6593—5075.042 = 
1517.958, y ocupa la última fila/columna de la matriz de SC y SP. 


SALIDA 2.1 
Estadísticos descriptivos 


SC Bruta Matriz de SC y SP (corregida) 


(SCB) voca inte adap auto comp 


7362 1089.333 865.167 224.833 402.167 955.833 
12551 865.167 1240.958 296.542 331.458 959.792 
675 224.833 296.542 123.958 — 59.042 164.708 
2313 402.167 331.358 59.042 277.958 496.292 
6593 955.833 959.792 164.708 496.292  1517.958 


Del mismo modo, la SP (corregida) para las variables X e Y se obtiene utilizando una fórmula equi- 
valente a la de la SC, 


2100 


SPxy =) XY- y 


=)Y XY-NXY (2.2) 


donde Y XY es la suma bruta (no corregida) de los productos cruzados observados de X e Y y el término 
[XI NN o bien NXY es la corrección de la media. Por ejemplo, para las variables X> (inte) e Y 
(comp), siendo Y X>Y = (43129) + (919 +...+ (14)(9) = 8536 y [0 X2J0. V)]/N = (521 x 349)/24 = 
7576.208, la SP (corregida) de X» e Y es la diferencia SPx, y = 8536 — 7576.208 = 959.792, y se muestra 
en la segunda fila, última columna de la matriz de SC y SP. 
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Es muy importante conocer el significado y la forma en que se representa una matriz simétrica de 
SC y SP como la que se muestra en las cinco últimas columnas de la salida 2.1, porque la utilizaremos 
profusamente a lo largo del texto. Prescindiendo del innecesario símbolo X para las variables explicati- 
vas X1], X>, X3 y X4 (se utilizan solamente los dígitos para distinguirlas) y manteniendo no obstante el 
símbolo Y para distinguir la variable de respuesta, se pueden diferenciar dos partes en la matriz de SC 
y SP, en concreto: 


— La diagonal principal contiene las SC de las variables (SC, = 1089.333, SC, = 1240.958, SCz = 
123.958, SC4 = 277.958 y SCy =1517.958). Si se dividen cada una de las SC por sus grados de li- 
bertad (que son N— 1 = 23, puesto que del número de casos N hay que restar la corrección de 
la media, que representa una restricción), se obtienen las varianzas que se muestran en la sex- 
ta columna de la salida 2.1. Por ejemplo, Sí = SC¡/23 = 1089.333/23 = 47.362 y SÍ, = SCy/23 = 
1517.958/23 = 65.998. 


— El triángulo inferior y el triángulo superior son simétricos y contienen las SP de todas las combina- 
ciones de variables. Excluyendo los elementos diagonales, los elementos de la primera columna 
del triángulo inferior son SP¡2 = 865.167, SP]3 = 224.833, SPj4 = 402.167 y SP] y = 955.833, que 
son iguales a los elementos de la primera fila del triángulo superior. Si se dividen cada una de 
las SP por sus grados de libertad (NV — 1) se obtienen las covarianzas, que no se representan en la 
salida 2.1, pero sí en la salida 2.2. Por ejemplo, S12 = 865.167/23 = 37.616 es la covarianza entre 
X1 y X2, Si3 = 224.833/23 = 9.775 es la covarianza entre X1 y X3, S14 = 402.167/23 = 17.486 y 
S1y = 955.833/23 = 41.558 es la covarianza entre Xl e Y. 


En ocasiones puede tener interés representar la MATRIZ DE COVARIANZA, que como hemos apuntado 
se obtiene dividiendo los elementos de la matriz de SC y SP por sus grados de libertad (N—1), y también 
la MATRIZ DE CORRELACIÓN, que es la razón entre una SP y la raíz cuadrada del producto de sus respec- 
tivas SC. Para cualesquier dos variables X e Y, su correlación Rxy (también llamada CORRELACIÓN DE 
ORDEN CERO) se obtiene aplicando 


IEC 


En la salida 2.2 se muestra una representación de la matriz de covarianza y en la salida 2.3 la matriz 
de correlación para las variables numéricas del Ejemplo 2.1. Observe también que ambas son, como 
la matriz de SC y PC, matrices cuadradas y simétricas. Además, los valores diagonales de la matriz de 
covarianza son varianzas y los valores diagonales de la matriz de correlación son unos por definición. 


SALIDA 2.2 
Matriz de covarianza 
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SALIDA 2.3 
Matriz de correlación 


2.3. ELMODELO NULO 


Dada una variable de respuesta, el modelo más simple de todos los modelos posibles es el MODELO 
NULO, también llamado MODELO DE EQUIPROBABILIDAD porque todos los valores estimados son igua- 
les. La ecuación de regresión definida por este modelo incluye un único parámetro denominado CONS- 
TANTE, INTERSECCIÓN U ORDENADA EN EL ORIGEN y representa el valor más probable de la variable de 
respuesta, es decir, su media Y. Llamando Y; (para ¡=1,..., N) a cada una de las N observaciones de la 
variable de respuesta, y siendo 7; = 4; (o sea, asumiendo una función de enlace identidad), el modelo 
nulo se formula, como ecuación general y como ecuación predictiva, mediante 


Y; = Bo + e; (ecuación general) 
Z (Q.4) 
41; = Bo (ecuación predictiva) 


Puesto que la matriz del modelo debe contener alguna información numérica para aplicar los algorit- 
mos de cálculo, una forma conveniente de parametrizar este modelo consiste en utilizar una constante 
o variable falsa (Xy = 1, para todo 1). Debido a esta parametrización, se dice que el modelo nulo no tie- 
ne variables explicativas, pero sí tiene un parámetro determinado por el vector de unos. Puesto que un 
vector de unos es una constante, el parámetro correspondiente se denomina CONSTANTE y delimita un 
valor de la función de regresión denominado INTERCEPCIÓN U ORDENADA EN EL ORIGEN. 

La salida 2.4 presenta los ESTIMADORES DE LOS PARÁMETROS del modelo nulo, la constante o inter- 
sección fo, que se etiqueta como B en la salida para resaltar que se trata de un parámetro no estanda- 
rizado. Junto al estimador Bo = 14.542 se muestra su error típico Sy = 1.658, la prueba de la hipótesis 
Ho : Po = 0 mediante £ = $p/Sy y su probabilidad bilateral asociada según la distribución £ de Student. 
Nótese que se etiqueta como P>|£| en la salida porque se trata de una prueba bilateral. Y finalmente los 
límites inferior y superior del intervalo de confianza (1C) del 95% en torno al estimador fo. Del resulta- 
do, t(23) = 8.769; P < .001 se infiere que la prueba es significativa porque se rechaza Hp : Bo = 0. En un 
modelo nulo, el estimador del parámetro fp es la media de la variable de respuesta, Bo = Y, y por tanto 
lo que se prueba es si la media difiere de cero, lo que usualmente carece de interés sustantivo. 


SALIDA 2.4 
Estimadores de los parámetros del modelo nulo 


Variable dependiente: comp 
Límites IC 95% 


Parámetro Inferior | Superior 
Constante a 11.111 17.972 
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La salida 2.5 presenta el ANÁLISIS DE VARIANZA, cuyo objeto es la descomposición de la variación total 
de la variable de respuesta, representada por la SUMA DE CUADRADOS TOTAL (SC7) en dos porciones 
independientes: 


— Una parte explicada por el modelo, que llamamos SUMA DE CUADRADOS DEL MODELO (SCpy), con 
£g lu = p grados de libertad, siendo p el número de predictores o variables explicativas especifi- 
cados en el modelo, y por tanto glyy = 0. En un modelo nulo siempre se cumple que SCy =0 y 
£g lu = 0, porque no se incluye ninguna variable explicativa, y por tanto no es posible utilizar la 
prueba F. Como consecuencia, el coeficiente de determinación, que es la razón entre la SCy y la 
SCr,es R?=0. 


— Otra parte no explicada por el modelo, que llamamos SUMA DE CUADRADOS RESIDUAL O DE ERROR 
(SCr), con glg = N— p-1=23 grados de libertad. La SCz representa la variación residual de la 
ecuación 2.4. En un modelo nulo siempre se cumple que SCr = SCp y que glr = gl. Observe 
además que la prueba de 1 de la salida 2.4 utiliza como grados de libertad los mismos grados de 
libertad del componente residual de la salida 2.5. 


SALIDA 2.5 
Análisis de varianza del modelo nulo 
Fuente | SC tipo III 
Modelo 0.000 


Residual 1517.958 
Total 1517.958 
R cuadrado = 0.000 


Al no disponer de ninguna variable explicativa, el modelo nulo carece de interés sustantivo. Sin em- 
bargo, es importante notar que, para toda variable de respuesta que sea objeto de explicación, existe 
siempre un modelo nulo que se utiliza como punto de partida para valorar el ajuste global relativo de 
modelos que incluyen una o más variables explicativas. 


2.4. MODELOS DE REGRESIÓN SIMPLE 


Una de las situaciones de investigación no experimental más comunes en Psicología se presenta 
cuando el investigador especifica un modelo que contiene una variable numérica para explicar una 
variable de respuesta. A partir de los ingredientes del modelo máximo del Ejemplo 2.1, hay tres posibles 
modelos de regresión simple que podrían especificarse: 


1. El modelo con el predictor voca (en adelante, modelo [X1]. 
2. El modelo con el predictor inte (en adelante, modelo [X2]). 
3. El modelo con el predictor adap (en adelante, modelo [X3]). 


Supongamos que nos interesamos por el primer modelo, el modelo [X1]. Llamando genéricamente 
Y a la variable de respuesta y X; a la variable explicativa o predictor voca, el modelo está formado por 
dos vectores (la constante y un predictor numérico) y el correspondiente MODELO DE REGRESIÓN SIMPLE 
se formula como ecuación general y como ecuación predictiva mediante 
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Y; = Bo+ PB1X1¡ + €; 


OA (2.5) 
Mi =PBo+ P1Xx; 


donde 
— Yi, ft, son los valores observados y estimados de la variable de respuesta; 


— Bo, $1 Bo, Br son respectivamente los parámetros y estimadores del modelo [X1]. Son los COEFI- 
CIENTES DE REGRESIÓN NO ESTANDARIZADOS, donde 


+. fp es la CONSTANTE, ORDENADA EN EL ORIGEN O INTERCEPCIÓN, y representa el valor que 
toma la variable de respuesta cuando el predictor Xi =0; 


+ f¡ es la PENDIENTE de la función de regresión que indica el cambio que se produce en la 
variable de respuesta comp por una unidad de cambio en el predictor voca. 


— X¡y: valores del predictor X¡ (voca). Se asume que los valores X¡; han sido arbitrariamente fijados 
por el investigador. 


— €j: término de error residual de la ecuación, que se define como e; = Y; — (tj. 


Es importante constatar que los términos implicados en la ecuación 2.5 corresponden a un modelo 
de la estructura LM cuyos ingredientes son: 


— En primer lugar, la variable de respuesta (Y) objeto de modelado, que se asume de naturaleza 
numérica. 


— En segundo lugar, el componente sistemático del modelo es el predictor lineal, que es igual al 
valor esperado puesto que se asume una función de enlace identidad (n; = 4;), y su magnitud es 
el componente de variación de la variable de respuesta que resulta explicada por el modelo. 


— En tercer lugar, el componente aleatorio del modelo son los errores residuales (e; = Y; — (1) y su 
magnitud representa el componente no explicado. Uno de los requisitos del modelado estadístico 
consiste precisamente en hacer mínimo este componente. 


2.4.1. Estimación de parámetros del modelo [X1] 


Utilizando como predictor la variable voca, el ajuste de un modelo de regresión simple requiere obte- 
ner los estimadores Bo y $1 de los parámetros Bo y fB1, utilizando para ello los N =24 casos de la muestra. 
El método de estimación usual es MÍNIMOS CUADRADOS ORDINARIOS (OLS, Ordinary Least Squares), así 
llamado porque persigue la minimización de la SC Residual o de Error, 


N N 
SCr= Y e = (Y; Bo- B1X1:)? — MINIMO (2.6) 
i=1 i=1 
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La estimación de los parámetros del modelo de regresión simple con el predictor voca (modelo [X1]) 
se representa de forma simplificada en la salida 2.6. El modelo [X1] tiene dos parámetros que descri- 
ben la forma como se pronostican los valores de comp a partir de los valores de voca. La predicción 
constituye la RECTA DE REGRESIÓN, que se representa en la figura 2.1 junto con la nube de puntos y su 
correspondiente INTERVALO DE PREDICCIÓN del 95%, siendo sus estimadores los siguientes: 


SALIDA 2.6 
Estimadores de los parámetros del modelo [X1] 


Variable dependiente: comp 


Límites IC 95% 
Parámetro Inferior | Superior 


Constante z 5.759 6.471 
voca E 0.528 1.227 


comp 


voca 


Figura 2.1. — Recta de regresión y estimadores del modelo [X1]. 


— El parámetro fp (constante, intercepción u ordenada en el origen), que se ha etiquetado como 
Constante en la salida, es el punto, para voca = 0, donde la recta intercepta con el eje de ordenadas 
y supone un valor de Bo = 0.356. Este punto no se muestra en la figura 2.1, que representa el 
intervalo de predicción solamente para los valores de voca observados, y no es significativamente 
diferente de cero, ya que £(22) = 0.121; P = .905. Aunque este parámetro no suele ser interpretado, 
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en algunos modelos avanzados (p. ej., modelos de moderación) puede tener interés metodológico 
centrar el predictor (o sea, restar los valores de voca respecto de su media). En tal caso, el punto 
donde la recta intercepta con el eje de ordenadas sería la media de la variable de respuesta comp, 
que tiene interés interpretativo. Más adelante volveremos sobre ello. 


— El parámetro 6; (pendiente), etiquetado como voca en la salida, es el cambio (aumento o dismi- 
nución) en unidades de la variable comp por unidad de cambio en voca. Puesto que el valor de 
$61 es positivo, cabe afirmar que por cada unidad de aumento en vocabulario existe un aumen- 
to de Br = 0.877 unidades en la comprensión lectora alcanzada por los niños. El incremento es 
significativamente diferente de cero, puesto que £(22) = 5.212; P <.001 (véase salida 2.6). 


Los parámetros del modelo [X1] pueden estimarse también con la ayuda de una calculadora de 
escritorio utilizando los datos descriptivos, en concreto la matriz de SC y SP (salida 2.1), los valores 
diagonales de la matriz de covarianza (57 y s?, salida 2.2) y de la matriz de correlación (Ry1, salida 2.3), 
y aplicando: 


» SPy1 2 Sí 

Pi == = Y1 => (2.7) 
SC; sí 

Bo = Y-fiXx (2.8) 


Observe que la ecuación 2.7 toma *1' en lugar de *X¡” para evitar dobles subíndices. Esta notación se 
utilizará también con modelos más avanzados. Siendo SC; = 1089.333 la SC del predictor X], SPy] = 
955.833 la SP entre la variable de respuesta Y y el predictor X; (salida 2.1), sE = 65.998 y Si = 47.362 
las varianzas de la variable de respuesta y del predictor respectivamente y la correlación entre ambas 
Ry1 =0.743, donde R5,, = Ri, = (0.743)? = 0.553, 


2 955.833 65.998 

BL E —— | = 0.877 
1089.33 47.362 

Po =  14.542- (0.877)(16.167) = 0.356 


La ecuación predictiva es (1; = 0.356+0.877 voca. Dado un valor de voca, la ecuación obtiene su valor 
estimado. Por ejemplo, para voca= 28 (caso 1), su valor estimado es (1, = 0.356 + (0.877)(28) = 24.925, y 
para voca = 8 (caso 24), su valor estimado es 24 = 0.356 + (0.877) (8) = 7.376. El intervalo de predicción 
(representado con fondo más oscuro sobre la figura) no es igual en todo el rango de valores de voca y de 
comp (véase figura 2.1), sino que es algo mayor con valores extremos que con valores centrales. 


2.4.2. Análisis de varianza del modelo [X1] 


La salida 2.7 representa el análisis de varianza del modelo [X1], cuyo objeto es la descomposición de 
la SC (corregida) de la variable de respuesta (SCr7 = 1517.958) en dos componentes independientes: 


— Un componente explicado por el modelo (SCy = 838.694), con gly = p = 1 grados de libertad, 
siendo p el número de variables explicativas o predictores del modelo. 
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— Un componente no explicado por el modelo, Residual o Error (SCp = 679.264), con glp = N- p— 
1 = 22 grados de libertad. 


SALIDA 2.7 
Análisis de varianza del modelo [X1] 


Fuente | SC tipo III MC 
Modelo 838.694 838.694 
voca 838.694 838.694 


Residual 679.264 30.876 
Total 1517.958 
R cuadrado = 0.553 (R cuadrado corregida = 0.532) 


La salida 2.7 incluye también una linea adicional, entre Modelo y Residual, utilizada para detallar 
los componentes especificados en el modelo. En el caso del modelo de regresión simple [X1], el único 
componente especificado es el predictor X, (voca). Puesto que solamente tiene un componente, las 
fuentes de variación para el modelo y para el predictor voca coinciden. 

En el cuadro 2.2 se detallan todos los términos que conducen a esta descomposición, las cantidades 
básicas (o SCB no corregidas) y las sumas de cuadrados (o SC corregidas). Puesto que no es práctico 
reproducir para cada modelo los resultados detallados del cuadro 2.2 (en particular cuando se trata 
de una muestra numerosa), en el cuadro 2.3 se resume la lógica y las fórmulas para el cálculo de la 
descomposición de la variación del modelo con el predictor voca en un formato que se utilizará a lo 
largo del texto para el cálculo manual de los componentes implicados en el análisis de la variación. 


— En la segunda parte del cuadro 2.2 se muestra la CORRECCIÓN DE LA MEDIA de la variable de res- 
puesta y la suma cuadrática bruta (SCB) de sus valores es (7 Y IN = NY? = (24) (14.542?) = 


5075.042. La media es una constante y por tanto su estimación requiere un parámetro (o sea, 
representa una restricción en los grados de libertad), a la que se asigna el símbolo [1]. 


— A continuación se representa la SCB de los VALORES OBSERVADOS de la variable de respuesta, 
y YE = 28? +... +8? = 6593, que requiere tantos términos como observaciones (ya que no tiene 
ninguna restricción), a la que se asigna el símbolo [2]. 


— Después se define la SCB de los VALORES ESTIMADOS, Y [15 = 24.925? +...+7.376% = 5913.736, 
cuya estimación requiere dos términos (el número de predictores p más uno), a la que se asigna 
el símbolo [3]. 


Con las tres cantidades básicas ([1],[2] y [3]) puede procederse a calcular los componentes esenciales 
del análisis de varianza de la salida 2.5, que se representan en la última parte del cuadro 2.2 y en la parte 
intermedia del cuadro 2.3. 


— En primer lugar, la SUMA DE CUADRADOS TOTAL (SCT = [2] — [1]) es la diferencia entre valores cua- 
dráticos observados y la corrección de la media, o sea, SC7 =Y y?- 03 Y)?/N =6593-5075.042 = 
1517.958, con gl7 =24-—1=23. La SCr es la magnitud que es objeto de descomposición en dos 
partes independientes: componente explicado y componente no explicado. 


— En segundo lugar, la SUMA DE CUADRADOS EXPLICADA POR EL MODELO (SC y = [3] — [1)), que es la 
diferencia entre la SCB de los valores estimados y la corrección de la media. 
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— Y finalmente, la SUMA DE CUADRADOS NO EXPLICADA O RESIDUAL (SC = SCT — SCm = SCr = [2] — 
[3]), que es la diferencia entre la SCB de los valores observados y los valores estimados. 


CUADRO 2.2 


Valores observados, valores estimados y residuales del modelo de regresión simple [X1] 


V. observado 
Y; 


Media 
Y 


V. estimado 


hi 


Grados de 
libertad 


RR Re 
72500300 00N- 


NNDNNNDN + a pp pop pl 
0 N HOOCOoO Jo Ccdmw- wn 


24 8 


29 
19 
26 
30 
23 


14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 
14.542 


24.925 
26.680 
19.660 
24.047 
21.415 
14.395 
20.538 
17.905 
12.641 
12.641 
12.641 
16.150 
13.518 
16.150 
16.150 
10.886 
12.641 
8.253 
9.131 
12.641 
4.474 
6.499 
7.376 
7.376 


[1]: SCB media 
[2]: SCB v. observados 
[3]: SCB v. estimados 


6593.000 


5075.042 


5913.736 


SCr: SC Total 
SCm: SC Modelo 
SCr: SC Residual 


1517.958 


838.694 


679.264 


Nótese la distinción que se hace entre las cantidades básicas, que son las sumas de cuadrados brutas 


(SCB) o no corregidas NY”, y Ye yy an se distinguen por utilizar símbolos numéricos ([1], [2] y [31) y 
son la base del cálculo, y las sumas de cuadrados corregidas (SCy, SCr y SCr), que son el fundamento 
de la descomposición de la variación. 

A su vez la SC Modelo contiene un único componente, la SC explicada por el predictor X, (voca), 
que es igual a SC porque el modelo solamente especifica un predictor (o sea, SC¡ = SCpy). 
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CUADRO 2.3 
Descomposición de la variación y fórmulas de cálculo para el modelo [X1] 


Cantidades básicas Procedimiento de cálculo No términos 

Corrección media 1] = NY? =5075.042 1 
Valores observados [2] =Y ya = 6593 N=24 
Valores estimados [8] = Ep = 5913.736 p+1=2 

Sumas de cuadrados Fórmulas de cálculo Grados de libertad 
SC Total (SCy) SCr=1[2]-[1]=1517.958 | glp=N-1=23 
SC Modelo (SC py) SCy = [3] — [1] = 838.694 | gly=2-1=1 
SC Residual (SCp) SCp = [2] — [3] =679.264 | glp=N-2=22 
Componentes del modelo Fórmulas de cálculo Grados de libertad 
SC voca (SC) SC1 = SC nm = 838.694 gli=1 


2.4.3. Ajuste global del modelo [X1] 


La salida 2.7 informa también de ajuste global del modelo [X1], un modelo especificado con un 
único predictor. Con modelos de la estructura LM, no es posible determinar el ajuste absoluto, pero sí 
el ajuste relativo. Un modelo se considera bien ajustado cuando la SCyy es significativa y no se inclu- 
ye ningún componente superfluo. Para valorar el ajuste global relativo pueden utilizarse los siguientes 
índicadores: 


— En primer lugar, LA RAZÓN F DEL MODELO (o la del componente voca porque hay un único pre- 
dictor) permite someter a prueba empírica si el modelo representa una desviación significativa 
del modelo nulo y se muestra en la salida 2.7. El resultado de la prueba empírica es: F(1,22) = 
27.164; P < .001, y por tanto puede afirmarse que este modelo obtiene un ajuste global relativo 
aceptable. Compruébese que, con un grado de libertad en el numerador, y los mismos grados de 
libertad residuales (o sea con modelos de regresión con un único predictor), la prueba F de la 
salida 2.7 y la prueba t de la salida 2.6 son equivalentes, ya que se verifica que [£(22)1? = F(1,22). 


— En segundo lugar, el COEFICIENTE DE DETERMINACIÓN, que se representa como RS (0) Ra yes la 
proporción de varianza de la variable de respuesta que resulta explicada por el modelo: 


RA (2.9) 


Para el modelo [X1], Ra = 838.694/1517.958 = 0.553, o sea, más de un 55 % de la varianza de comp 
está explicada por voca. El coeficiente de determinación es un indicador de ajuste global relativo y 
se interpreta en relación con el modelo nulo, cuyo coeficiente de determinación es cero. El coefi- 
ciente de determinación se representa también al pie de la salida 2.7. Para probar si la proporción 
de varianza explicada por el coeficiente de determinación es estadísticamente significativa (res- 
pecto del coeficiente de determinación del modelo nulo, que es cero) se emplea: 
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Re 18M 


= ———>—— (2.10) 
(1 RE)/8 lr 


donde gly y g [a son respectivamente los grados de libertad del modelo y del residual. En un mo- 
delo de regresión simple, glyy = p = 1, porque sólo hay un predictor y gr es N—-p-1= N-—2, Para 
el modelo [X1], la proporción de varianza explicada es estadísticamente significativa: F(1,22) = 
27.164; P < .001. Nótese que la prueba es equivalente a la prueba F del modelo de la salida 2.7. 


Sin embargo, Na es una medida influida por el tamaño muestral y el número de predictores del 
modelo. Es un hecho bien conocido que, a medida que se introducen predictores en un modelo 
de regresión, el coeficiente de determinación se incrementa en una magnitud que depende del 
número de predictores y de su relevancia. Es por ello crucial la selección de un tamaño muestral 
apropiado (Kelley y Maxwell, 2003). Cuando tamaño muestral y número de predictores no están 
adecuadamente equilibrados, o cuando se combinan muchos predictores con pocos casos, resul- 
ta más conveniente utilizar el COEFICIENTE DE DETERMINACIÓN AJUSTADO O CORREGIDO Ras que 
neutraliza o reduce la contribución del azar teniendo en cuenta el tamaño muestral y suele utili- 
zarse como índice de MAGNITUD DEL EFECTO. El coeficiente Ri supone siempre una reducción 
(shrinkage) en la magnitud del coeficiente de determinación Eh que, en el caso de resultar ne- 
gativo, adopta por convención el valor límite de O. La fórmula de cálculo es muy similar a la del 
coeficiente de determinación no ajustado, pero emplea MC en lugar de SCs: 


a SCRI(N=p-=1) 
Rei =1 (2.11) 
SCTIN-1) 


donde p es el número de predictores del modelo (en este ejemplo, p = 1) y SCT/(N-=1) = Se 
es la varianza de la variable de respuesta. Para el modelo [X1], el coeficiente ajustado es 10 = 
1 — (30.876/65.998) = 0.532, un valor muy similar, aunque 11 milésimas más pequeño, que el coe- 
ficiente no ajustado, lo que apunta para estos datos un moderado equilibrio entre el número de 
casos y el número de predictores. Se representa entre paréntesis también al pié de la salida 2.7. 


— El ERROR TÍPICO RESIDUAL Sr (también llamado ERROR TÍPICO DE ESTIMACIÓN o de PREDICCIÓN) 
se define como la media de las desviaciones cuadráticas entre valores observados y valores esti- 
mados, y se interpreta también en ocasiones como indicador de ajuste global, pero no hay una 
prueba inferencial para este indicador. Se obtiene calculando la raíz cuadrada de la MC Residual, 
Sr = v679.264/22 = V/30.876 = 5.557. En general, cuanto más bajo sea Sg mejor será el ajuste del 
modelo a los datos, o sea, mejor la predicción de los datos a partir del modelo. El error típico resi- 
dual es también la desviación típica, que se asume constante, de las distribuciones de la variable 
de respuesta para cada uno de los valores que toma el predictor (véase figura 2.1). En consecuen- 
cia, utilizando el modelo [X1], la recta de regresión para pronosticar comp a partir de voca origina 
un error típico residual de Sp[X1] = 5.557 puntos, una reducción importante respecto del modelo 
nulo, donde Sp = 8.124, de casi un 32%, en concreto, de 100 x (8.124— 5.557)/8.124 = 31.6. 
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2.4.4. Ajuste condicional con el modelo [X1] 


En el contexto del análisis de regresión simple sólo es posible comparar dos modelos: el modelo 
nulo (o modelo restringido) y el modelo con el predictor voca (o modelo aumentado), el primero de los 
cuales es parte del segundo. El ajuste condicional se practica preferentemente con MODELOS ANIDADOS, 
es decir, con modelos donde uno de ellos es parte del otro, y consiste en comparar las SCp de los dos 
modelos para seleccionar el más apropiado aplicando una prueba estadística convencional. 

En la salida 2.8 se aplica la estrategia de ajuste condicional alos dos modelos citados. Observe que el 
modelo de regresión simple con el predictor voca es el modelo aumentado (modelo 2) y que el modelo 
nulo es el modelo restringido (modelo 1). La SC Residual del modelo restringido es SC = 1517.958, 
con glp = 23 grados de libertad (véase salida 2.4) y la SC Residual del modelo aumentado es SCp[X1] = 
679.264, con glr[X1] = 22 grados de libertad (véase salida 2.7). La diferencia entre ambas es ASCp = 
838.694, con Agl!r = 1, lo que supone un porcentaje de reducción en SC Residual de 838.694/1517.958 = 
55.25 %, una reducción importante en relación a la SC Residual del modelo nulo. Para determinar si tal 
reducción es significativa, o lo que es lo mismo, para saber cuál de los dos modelos se ajusta mejor, se 
utiliza 


_ ASCR/Aglr 
— SCr[XU/glr[X1)] 


(2.12) 


que es la razón entre los incrementos en SC y g !g de ambos modelos dividida por la razón entre la suma 
de cuadrados del modelo 2, el modelo aumentado (SCr[X1]), y sus correspondientes grados de libertad 
(g!r[X1)). El resultado es también F(1,22) = (838.694/1)/(679.264/22) = 27.164; P < .001. Obsérvese que 
se obtiene exactamente el mismo valor F del modelo de la salida 2.7, ya que lo que de hecho prueba el 
ajuste condicional es también la diferencia entre el modelo [X1] y el modelo nulo. 


SALIDA 2.8 
Ajuste condicional de los modelos [X1] y nulo 
Modelo 1: comp= 1 
Modelo 2: comp= 1 + voca 
Modelo SCr ASCR 
1: [0] 1517.958 


2: [X1] 679.264 838.694 


Del mismo modo se puede proceder con la estrategia de ajuste condicional valorando la reducción 
en la proporción de varianza explicada mediante el coeficiente de determinación. La prueba F corres- 
pondiente es la siguiente 


AR?/Aglr 


= ——__———— (2.13) 
1—R5,/glg[X1) 


donde nuevamente el numerador son los incrementos en proporción de varianza explicada y en grados 
de libertad residuales, mientras que el denominador es el complemento del coeficiente de determi- 
nación del modelo aumentado y sus correspondientes grados de libertad. Para los datos del ejemplo, 
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y salvando los errores de redondeo, F(1,22) = (0.553/1)/(0.447/22) = 27.164; P < .001. Obsérvense las 
fórmulas empleadas para definir los modelos en la salida 2.8, con el parámetro 1 para referirse a la cons- 
tante y el parámetro voca para referirse al predictor X¡. Esta notación es típica del programa R, de donde 
se ha tomado la salida, porque el programa SPSS no realiza ajuste condicional. 

La decisión del investigador se plantea en los términos siguientes: dados dos modelos anidados, si el 
modelo aumentado representa una diferencia en variación residual estadísticamente significativa res- 
pecto del modelo restringido, lo más apropiado es aceptar tentativamente el modelo aumentado como 
modelo óptimo, ya que contiene información relevante que no contiene el modelo restringido. Por el 
contrario, si el modelo aumentado supone una diferencia no significativa respecto al modelo restringi- 
do, lo más apropiado es aceptar el modelo restringido, puesto que el modelo aumentado no contiene 
información relevante que no esté ya contenida en el modelo restringido. En consecuencia, aplicando 
la estrategia de ajuste condicional, se puede afirmar que el modelo [X1] explica mejor la variación en la 
variable de respuesta que el modelo nulo. 


2.5. MODELOS DE REGRESIÓN MÚLTIPLE 


2.5.1. Regresión múltiple con dos predictores 


Los modelos de regresión múltiple extienden a dos (o más) variables explicativas los modelos de 
regresión simple, lo que sin duda supone un acercamiento más realista a los problemas de la investiga- 
ción aplicada. Sin embargo, es preciso introducir algunos cambios y afrontar nuevas complejidades que 
el investigador debe conocer para interpretar adecuadamente los resultados. 

Siendo ahora X, y X» dos predictores numéricos e Y la variable de respuesta, la formulación general 
de un modelo de regresión múltiple con dos predictores, por ejemplo voca e inte (modelo [X1, X2]) es 


2 
Y, = Po+fPiXi+P2Xi2+e:=PBo+ ). PjXi¡+e: (2.14) 
ja 
A A A A 2 A 
Mi = Po+PiXu+P2Xi=PBo+ ) PXij (2.15) 
ja1 


lo que ahora supone un PLANO DE REGRESIÓN (y no una recta, como en la figura 2.1) con tres dimensio- 
nes (como se muestra en la figura 2.2), donde: 


— Yi, ft, son respectivamente los valores observados y estimados de la variable de respuesta Y. 
— X;1, Xy2 son los valores prefijados de las variables explicativas voca (X]) e inte (X>). 


— Po, P1, P2 son los COEFICIENTES DE REGRESIÓN PARCIAL MÉTRICOS, que más propiamente se repre- 
sentan mediante la siguiente notación: 


+ fyo esla constante, intersección u ordenada en el origen del plano de regresión. Se asume la 
existencia de una constante o variable falsa (Xp) para todo sujeto , siendo sus valores X;p = 1 
para todo 1). Este parámetro representa el valor de Y cuando X, = X> = 0, o sea, cuando 
todos los predictores son cero. Si los predictores se centran (o sea, se resta cada uno de los 
valores de su media), el valor de la constante sería la media de la variable de respuesta. 
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. Briz es la pendiente del plano de regresión respecto de X/, suponiendo constante X>. 
» By». esla pendiente del plano de regresión respecto de X», suponiendo constante X;. 


comp 


In 


Figura 2.2. — Plano de regresión del modelo [X1, X2]. 


Nótense los cambios introducidos en los subíndices de los parámetros que se requieren con mo- 
delos de regresión múltiple. Su interpretación es sin embargo simple; por ejemplo, $fy1.. es el 
coeficiente de regresión parcial métrico de X¡ sobre Y, independientemente de (o manteniendo 
constante) X>. Son coeficientes métricos porque se miden en la misma escala que la variable de 
respuesta y son coeficientes parciales porque representan una relación entre dos variables (un 
predictor y la respuesta) independientemente del otro predictor incluido en el modelo. 


— ej: es el error residual del modelo. Como tratamos más adelante, suponemos que los errores se 
distribuyen de forma normal e independientemente, e; = NID(0,0?), y son independientes entre 
sí, C(e;, E = 0 e independientes de los predictores, C(e;, X,) = C(e;, X>) = 0. 


A. Estimación de parámetros del modelo [X1,X2] 


La salida 2.9 muestra los estimadores de los parámetros del modelo de regresión múltiple con dos 
predictores (X1, X>). Nótese que hemos incorporado dos nuevas columnas a la salida que no eran ne- 
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cesarias con modelos más sencillos. La interpretación de los parámetros del modelo [X1, X2] requiere 
tener en cuenta que se trata de coeficientes de regresión parcial métricos. Así, para interpretar Py]. se 
argumenta que una unidad en el predictor X, (voca) produce un incremento significativo de 0.590 uni- 
dades en la variable de respuesta, manteniendo constante X». Del mismo modo, para interpretar Py» 1 
se argumenta que un incremento de una unidad en el predictor X> (inte) produce un incremento no 
significativo de 0.362 unidades en la variable de respuesta, manteniendo constante el predictor X;. 


SALIDA 2.9 
Estimadores de los parámetros del modelo [X1, X2] 


Variable dependiente: comp 


Límites IC 95% 


Parámetro Inferior | Superior Tolerancia 


Intersección E -10.131 4.418 
voca a 0.083 1.097 0.4463 
inte a 0.113 0.837 0.4463 


Un serio inconveniente de los coeficientes de regresión parcial métricos es que la magnitud de la 
pendiente del plano de regresión depende de la escala de medida del predictor correspondiente y por 
tanto no es posible su comparación. Los coeficientes de regresión parcial métricos utilizan la misma 
escala de las variables utilizadas y se denominan también COEFICIENTES B (su formulación es Py;.1). 
Aunque es un tema controvertido, en ocasiones puede resultar de interés comparar la magnitud de dos 
o más diferentes pendientes de un plano de regresión. Para ello es preciso tipificar todas las variables, 
es decir, convertir la escala de medida directa del predictor en una escala tipificada. La transformación 
produce como resultado los COEFICIENTES DE REGRESIÓN PARCIAL ESTANDARIZADOS O TIPIFICADOS, tam- 
bién llamados COEFICIENTES BETA ESTANDARIZADOS (Br, e: Utilizando las desviaciones típicas de las 
variables implicadas (o sea, las raíces cuadradas de los elementos diagonales de la matriz de covarianza 
de la salida 2.2), la tipificación se realiza para el predictor X;, siendo X; el otro predictor considerado e 
Y la variable de respuesta, mediante 


. Sj 
Pri Brix (52) (2.16) 


Así, siendo Sy = V65.998 = 8.124, S¡ = V47.362 = 6.882 y S2 = V53.055 = 7.345 las desviaciones típicas 
de Y, X, y X) (véase salida 2.2), los coeficientes de regresión parcial estandarizados del modelo [X1, X2] 
son De = 0.590 x (6.882/8.124) = 0.500 y Pro = 0.362 x (7.345/8.124) = 0.328. Muchos paquetes es- 
tadísticos suelen incorporar los coeficientes B y Beta en la salida de los estimadores de los parámetros. 
Siguiendo esta tradición, los coeficientes Beta se muestran también en la penúltima columna de la salida 
2.9. Nótese que los coeficientes Beta solamente pueden definirse para cada uno de los dos predictores 
pero no para la constante. 

La última columna de la salida 2.9 contempla también un estadístico denominado TOLERANCIA 
(TOL) que evalúa el grado de redundancia existente entre los predictores especificados para pronos- 
ticar la variable de respuesta, una cuestión que trataremos con más detalle en la sección 2.7 de este 
mismo capítulo. Para un predictor X;, la tolerancia se define como el complemento del cuadrado del 
coeficiente de correlación del predictor X; con el otro predictor (Xx) y se formula como 
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TOL¡=1-=ríy (2.17) 


Nótese que, en el caso de un modelo de regresión múltiple con dos predictores, el valor de tolerancia 
es el mismo para los dos predictores. Consultando la salida 2.2, rj2 = r21 = 0.744 y TOL¡ = TOL> = 
1 — (0.744)? = 0.4463. 


Los parámetros de la salida 2.9 permiten definir la ecuación predictiva para el modelo [X1, X2]: 


A; = -2.857+0.590X] + 0.362 X» 


y utilizando valores concretos de X1 y X> se obtienen los valores estimados. Por ejemplo, para el pri- 
mer caso, (11 = -2.857 + (0.590)(28) + (0.362)(43) = 29.234, y para el último, (124 = -2.857 + (0.590) (8) + 
(0.362) (14) = 6.933. La salida 2.9 incluye también la inferencia estadística con los coeficientes de regre- 
sión. Para la variable vocala pendiente del plano de regresión es significativa, 1(21) = 2.419; P < .05, pero 
para la variable inte no lo es, t(22) = 1.586, P > .05. Es importante tener en cuenta que los grados de 
libertad de las pruebas £ en las salidas de estimadores de parámetros son siempre los grados de libertad 
residuales (para este caso, g/r = 21), que se muestra en la salida 2.10, pero no en la salida 2.9. 

Los coeficientes de regresión parcial de un modelo de regresión derivan de los diferentes tipos de 
correlación que pueden definirse en este contexto. La CORRELACIÓN DE ORDEN CERO yz €s la familiar 
correlación de Pearson, que se define para dos variables numéricas X; y Xx. La salida 2.3 muestra la 
matriz de correlaciones de Pearson entre las variables numéricas del fichero lectura. Así, ry] = 0.743 es 
la correlación de Pearson entre la variable de respuesta Y y el predictor X], ry2 = 0.699 es la correlación 
de Pearson entre la variable de respuesta y el predictor X>, y r12 = 0.756 es la correlación de Pearson 
entre los predictores X] y Xz. 

La correlación entre una variable de respuesta (Y) y un predictor X $ dado otro predictor Xy, se 
denomina CORRELACIÓN PARCIAL, y se representa como ry;.z, cuando su objeto es eliminar el efecto 
de X; de la relación entre X; e Y. Así, ry1.2 es la correlación parcial entre X¡ e Y controlando (o sea, 
parcializando o eliminando) la influencia de X» tanto de Y como de X;. Si se realizara un análisis de 
regresión simple de X, sobre Y y se salvaran los residuales (ey. 2) y después se realizara otro análisis de 
regresión simple de X, sobre X1 y se salvaran también los residuales (e 2), la correlación de Pearson 
entre los residuales ey. 2 y e1.2 sería la correlación parcial entre X] e Y, que elimina X> tanto de Y como 
de X1. Las correlaciones parciales pueden obtenerse de forma directa a partir de las correlaciones de 
orden cero utilizando 


PTYj=TYkFjk 


PY jk= 
y Uri J0=r;) 


(2.18) 


Por su parte, la correlación entre dos variables, Y y X;, dada una tercera, X¡, se denomina CORRE- 
LACIÓN SEMIPARCIAL, se representa COMO Ty(¡.x), y su objeto es eliminar el efecto de Xy, del predictor 
X;, pero no de Y. Así, ry(1.2) es la correlación semiparcial entre Y y X] eliminando la influencia de X, 
sobre X] y ry(2.1) es la correlación semiparcial entre Y y X2 eliminando la influencia de X] sobre X>. Es 
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la correlación de Pearson entre Y y los residuales e, 2 y se obtiene también a partir de las correlaciones 
de orden cero con 


NS e (2.19) 


donde el término del denominador es la raíz cuadrada de la tolerancia definida más arriba. Utilizando 
los resultados de la salida 2.3, las correlaciones semiparciales son ry (1.2) = 0.2229/v0.4443 = 0.3337 y 
ry.1) = 0.1459/v0.4443 = 0.2188. 

La ecuación 2.19 se aplica a modelos de regresión múltiple con dos predictores, pero se complica 
mucho para modelos que incorporan más de dos predictores. Una fórmula simplificada que generaliza 
este resultado a modelos de regresión múltiple con más de dos predictores consiste en utilizar 


rv = By yx y TOLj (2.20) 


donde P> es el coeficiente de regresión parcial tipificado de X; y TOL) es la tolerancia, o sea, el gra- 
do de redundancia del predictor X; con el predictor X; para explicar la variable de respuesta. Salvan- 
do errores de redondeo, para el predictor X1, ry(1.2) = (0.4996) 0.4463 = 0.3337 y para el predictor X», 
ryq.1) = (0.3276) y0.4463 = 0.2188. 

Nótese la sutil diferencia que existe entre los coeficientes de correlación parcial y semiparcial, cuyas 
fórmulas sólo difieren en el denominador. Mientras en la correlación parcial X, se excluye tanto de X; 
como de Y, y de ahí el símbolo ry; 2, en la correlación semiparcial X, se excluye de X,, pero no de 
Y, y de ahí el símbolo ry(1.2). Excluir de la relación entre una variable de respuesta y un predictor a 
otro/s predictor/es representa una forma de CONTROL ESTADÍSTICO muy importante en el contexto de 
la investigación no experimental. Volveremos a esta cuestión en el capítulo 6. 

El mismo principio de control se utiliza de hecho para definir los coeficientes de regresión parcial 
métricos de un modelo de regresión con p = 2 predictores a partir de una ligera modificación de los 
coeficientes de correlación semiparciales, consistente en utilizar como denominador el valor de tole- 
rancia (en lugar de la raíz cuadrada de la tolerancia). Así, los estimadores de las pendientes Py1.2 y PBy2.1 
y la constante Pyo pueden definirse respectivamente empleando las ecuaciones 2.21-2.23. Y siendo 
Sy = 8.123, S1 = 6.882 y S2 = 7.547 las desviaciones típicas de Y, X] y X», respectivamente, los coefi- 
cientes de regresión parcial métricos son Brio = 0.590, Bror = 0.362 y Bro = 2.857. 


» (ry1 — ry2r12)Sy 
Briz = —— > =— (2.21) 
(1-rÍ)81 
4 - S 
a (ry2 pe r12)Sy (2.22) 
a e rí2)S2 
Bro = Y- Bri2X1 SG Br21Xo (2.23) 
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B. Análisis de varianza del modelo [X1,X2] 


El análisis de varianza del modelo [X1, X2] consiste en una descomposición de la variación total 
(SCT = 1517.958), en dos componentes independientes, que se muestran en la salida 2.10, la variación 
explicada por el modelo (SCyy = 911.391) y la variación no explicada por el modelo (SCf = 606.567). El 
modelo [X1, X2] se especificó incluyendo dos componentes, y la variación explicada por cada uno de 
ellos se incluye también en la salida: SC, = 169.061 y SC2 = 72.697. Nótese que la suma de las dos SC 
de los componentes del modelo no es igual a la SC del modelo, ya que 911.391 > (169.061 + 72.697). 
Este es un problema típico de los modelos de regresión múltiple, denominado multicolinealidad, que 
trataremos con mayor detalle en la sección 2.7. 


SALIDA 2.10 
Análisis de varianza del modelo [X1, X2] 


MC 
455.695 
169.061 

72.697 
28.884 


Fuente 
Modelo 

voca 

inte 


SC tipo III 
911.391 
169.061 

72.697 

Residual 606.567 

Total 1517.958 

4 R cuadrado = 0.600 (R cuadrado corregida = 0.562) 


El cuadro 2.4 presenta de forma compacta la descomposición de la variación utilizando el mismo 
formato de modelos anteriores. Observe que las cantidades [2] y [1] son las mismas que ya se obtuvieron 
con el modelo de regresión simple, pero la cantidad [3] son los valores estimados por el modelo [X1, X2], 
en concreto, Y [15 =29.234* +... -+6.933? = 5986.433. 


CUADRO 2.4 
Descomposición de la variación y fórmulas de cálculo para el modelo [X1, X2] 


Cantidades básicas Procedimiento de cálculo No términos 
Corrección media NY? = 5075.042 1 
Valores observados dE Y? = 6593 N=24 
Valores estimados 2 (1, = 5986.433 p=3 
Sumas de cuadrados Procedimiento de cálculo Grados de libertad 

SC Total (SCr) SCy = [2] — [1] = 1517.958 gly=24-1=23 
SC Modelo (SCy) SCm = [3] - [1] = 911.391 glm=3-1=2 
SC Residual (SCr(Y|X1, X2)) | SCp = [3] — [2] = 606.567 glp=24-3=21 

Componentes del modelo Procedimiento de cálculo Grados de libertad 
SCr(Y|X1) 1517.958 — [(955.833)2/1089.333] =679.264 | 24-2=22 
SCr(Y/1X2) 1517.958— [(959.792)? /1240.958] ="775.628 | 24-2=22 
SC 679.264 — 606.567 = 72.697 glo =22-21=1 
SC1 775.628 — 606.567 = 169.061 gl¡ =22-21=1 


Con un modelo de regresión múltiple se hace necesario descomponer además la SCyr en los dos 
componentes especificados, a saber, el predictor voca (SC) y el predictor inte (SC2). La solución más 
apropiada para el cálculo de los dos componentes individuales especificados en el modelo consiste en 
utilizar el ajuste condicional de modelos, como se indica en el cuadro 2.4 y se detalla más adelante. 
La forma de aplicar el ajuste condicional consiste en obtener la SCz resultante de ajustar modelos que 
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contengan todas las variables, menos una. Así, con dos predictores es preciso ajustar un primer modelo 
que contenga sólo voca, para obtener SCr(Y|X1), y un segundo modelo que contenga sólo inte, para 
obtener SCr(Y|X2). Puesto que la SC residual del modelo completo es SCr(Y|X1, X2), la diferencia 
entre este modelo y el primero será la SC explicada por la variable inte, y la diferencia con el segundo 
modelo será la SC explicada por la variable voca. 

Para obtener con una calculadora de escritorio SCrR(Y|X1) y SCr(Y|X2) es necesario recurrir a la 
matriz de SC y PC de la salida 2.1. Para calcular SCr(Y|X1), nos interesan los valores de la primera fila 
(que corresponde al predictor X1) y la última columna (que corresponde a la variable de respuesta Y) 
de la matriz de SC y PC. Para calcular SCr(Y|X2), se recurre a la segunda fila y última columna de la 
matriz de SC y PC. La ecuación que se aplica en estos casos es 


2 
SPx1 y 955.833? 
SCr(YIX1) = SCy- 22 =1517.958- 2 - 679.264 
SCx1 1089.333. =—— 
2 
SPxa y 959.792? 
SCr(YIX2) = SCy- =1517.958- == 775.628 
SCxo 1240.958 


Siendo SC(Y|X1, X2) = 606.567, la diferencia SCr(Y|X1) — SCr(Y|X1, X2) = 679.264 — 606.567 = 
72.697 es la SC explicada por X2 (inte), y la diferencia SCr(Y|X2)-SCrR(Y|X1, X2) = 775.628-—606.567 = 
169.061 es la SC explicada por X1 (voca). 

Nótese finalmente que la suma de los dos componentes (SC; + SC) = 169.061 + 72.697 = 241.758) no 
es igual a la SC explicada por el modelo en su conjunto (SCy = 911.391), como sería esperable. Esta es 
una de las consecuencias del problema de la multicolinealidad que tratamos en la sección 2.7. 

Para el modelo de regresión múltiple con dos predictores, una alternativa más sencilla para calcular 
la SC atribuida a cada uno de los componentes de un modelo de regresión múltiple consiste en uti- 
lizar los COEFICIENTES DE DETERMINACIÓN SEMIPARCIALES, O sea, los cuadrados de los coeficientes de 
correlación semiparciales que desarrollamos anteriormente (ecuaciones 2.19 y 2.20), mediante 


SCj= (SCI ¿19) (2.24) 


donde SCr es la suma de cuadrados total. Salvando los errores de redondeo, para el predictor X; (voca), 
SCi¡ = (1517.958) (0.3337)? = 169.061 y para el predictor X» (inte), SC = (1517.958) (0.2188)? = 72.697. 


C. Ajuste global del modelo [X1,X2] 


La salida 2.10 aporta toda la información sobre el ajuste global relativo del modelo de regresión 
múltiple [X1, X2]. En comparación con el modelo [X1], del que concluimos que se ajustaba satisfacto- 
riamente, los indicadores de ajuste global coinciden en apuntar que este modelo también es apropiado: 


— El estadístico F para el modelo en su conjunto somete a prueba empírica si el modelo de regresión 
múltiple [X1,X2] difiere del modelo nulo, o sea, si los predictores que incluye son en conjunto 
estadísticamente significativos. El resultado revela que sí: F(2,21) = 15.777; P <.001. 


— El coeficiente de determinación, isa = Roa = .600, indica que el 60% de la varianza muestral de 
comp resulta explicada por la combinación de los predictores voca e inte (véase salida 2.10). El 
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coeficiente de determinación ajustado corrige el sesgo muestral del coeficiente de determinación 
Ro = .562) y denota un leve desequilibrio entre tamaño muestral y número de predictores. La 
valoración de ambos coeficientes se realiza en función de la variación a explicar, o sea, en función 
de la SC Total de la variable de respuesta comp, pero muchos recomiendan utilizar Re x =0.562 
como índice de magnitud del efecto. La prueba F para valorar la significación del coeficiente de 
determinación (ecuación 2.12) es F(2,21) = 15.777; P < .001. Adviértase que esta prueba es exac- 
tamente igual a la prueba F para el ajuste global relativo del modelo. 


— El error típico de estimación (Sp) es la desviación típica de la distribución muestral de los valores 
ajustados, que se supone constante (homocedástica) para cada combinación de valores de los dos 
predictores del modelo de regresión múltiple. Su magnitud es igual a la raíz cuadrada de la Media 
Cuadrática Residual o Error, Sr[X1, X2] = v28.844 = 5.374, con 21 grados de libertad residuales. 
Nótese que Sp para el modelo [X1, X2] es algo inferior al modelo de regresión simple, Sr[X1] = 
5.557, con 22 grados de libertad residuales, y sensiblemente inferior al del modelo nulo, Sg[X0] = 
8.124, con 23 grados de libertad. Respecto al modelo nulo, representa una reducción de 100 x 
(8.124—5.374)/8.124 = 33.85%. Como norma general, cuanto más bajo es Sg mejor es el ajuste del 
modelo, pero no suele utilizarse ninguna prueba de significación para probar la reducción. 


Los indicadores de ajuste global permiten por tanto concluir que el ajuste del modelo es aceptable. 
Sin embargo, teniendo en cuenta que lo que el modelado estadístico busca es el mejor modelo que ex- 
plique la variación en la variable de respuesta con el menor error posible, el problema que se plantea 
entonces es un problema de parsimonia: ¿se trata de un modelo parsimonioso?, o expresado de forma 
diferente, ¿todas las variables explicativas del modelo son igualmente importantes? Como norma gene- 
ral, un modelo de regresión ajustado no debe ser interpretado si no son estadísticamente significativos 
todos y cada uno de los componentes especificados en el modelo. 

Una atenta mirada a la salida 2.10 muestra que mientras que el predictor voca es estadísticamente 
significativo, F(1,21) = 5.853; P = .025, el predictor inte no lo es, F(1,21) = 2.517; P > .05, y por tanto 
aplicando el principio de parsimonia este componente debería ser eliminado por tratarse de una va- 
riable irrelevante. No obstante, la decisión de eliminar uno (o más) componentes de un modelo debe 
realizarse con suma precaución, teniendo en cuenta el tipo de sumas de cuadrados utilizada y otras 
consideraciones que trataremos más adelante. En caso de duda, sin embargo, lo más recomendable es 
emplear la estrategia de comparación de modelos o ajuste condicional (Judd et al., 2008). 


D. Ajuste condicional con el modelo [X1,X2] 


Dado un conjunto de predictores en un modelo de regresión múltiple, la estrategia de ajuste condi- 
cional permite someter a prueba la significación estadística de un predictor particular, o de la selección 
de un conjunto de predictores. Para ello deben definirse dos modelos alternativos: un modelo aumen- 
tado, que incluye un determinado número de predictores, y un modelo restringido, que excluye uno (o 
más) de los predictores del modelo aumentado. La prueba obtiene una razón F utilizando como nume- 
rador la razón entre la diferencia entre las SC y la diferencia entre los g/ de ambos modelos y como 
denominador la razón entre la SCz y glp del modelo aumentado. 

Por ejemplo, si se desea probar el ajuste condicional del predictor inte para un nivel de significación 
(usualmente, a = .05), el modelo [X1, X2] es el modelo aumentado (modelo 2) y el modelo [X1], o sea, 
el modelo con todos los predictores exceptuando inte, es el modelo restringido (modelo 1). Del resulta- 
do, que se muestra en la salida 2.11, se infiere que el predictor inte no es estadísticamente significativo. 
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Utilizando la última línea de la salida 2.11 se obtiene F(1,21) = 2.517;P > .05. Nótese que es el mis- 
mo resultado que se muestra en la salida 2.10 para la variable inte. Observe además que el incremento 
ASC = SC) = SC(inte) es la suma de cuadrados explicada de forma única por el predictor inte, como 
se expone también en el cuadro 2.4. 


SALIDA 2.11 
Ajuste condicional de los modelos [X1] y [X1,X2] 
Modelo 1: comp= 1 + voca 
Modelo 2: comp= 1 + voca + inte 
Modelo SCr 
1: [X1] 679.264 


2:[X1,X2] | 606.567 


Del mismo modo, si se desea probar el ajuste condicional del predictor voca con a = .05, el mo- 
delo [X1, X2] es el modelo aumentado (modelo 2) y el modelo [X2], o sea, el modelo con todos los 
predictores exceptuando voca, es el modelo restringido (modelo 1). El resultado del ajuste condicional 
es F(1,21) = 5.853; P = .025 (salida 2.12) y la decisión a adoptar es que hay diferencias significativas 
entre el modelo aumentado y el modelo restringido, por lo que se prefiere el modelo aumentado. Por 
otra parte, la disminución en el componente de error SCp atribuye al predictor voca una diferencia de 
ASC = SC; = SC(voca) = 169.061, que es la SC explicada de modo único por tal predictor (cuadro 2.4). 


SALIDA 2.12 
Ajuste condicional de los modelos [X2] y [X1,X2] 
Modelo 1: comp= 1 + inte 
Modelo 2: comp= 1 + voca + inte 
Modelo SCr ASCR 
1: [X2] 775.629 


2:[X1,X2] | 606.567 169.061 


2.5.2. Regresión múltiple con más de dos predictores 


La generalización del modelo a p > 2 variables explicativas o predictores es relativamente simple, 
pero su aplicación supone ahora un HIPERPLANO DE REGRESIÓN que requiere tres o más dimensiones. 
Las fórmulas para la ecuación del modelo y para la ecuación predictiva son, respectivamente, 


p 
Y, = Po+d Pj¡Xi¡+ei (2.25) 
j=1 
OO A 
Pi = Po+ Dd BjXij (2.26) 
j=1 


Concentrando el análisis sobre las variables numéricas voca (X|), inte (X2) y adap (X3) de los da- 
tos del Ejemplo 2.1, hay un modelo de regresión múltiple que incluye los tres predictores, el modelo 
[X1, X2, X3], que analizamos a continuación. 
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A. Estimación de parámetros del modelo [X1,X2, X3] 


La salida 2.13 resume la información fundamental acerca de los estimadores de los parámetros del 
modelo [X1, X2, X3], que son los siguientes: 


SALIDA 2.13 
Estimadores de los parámetros del modelo [X1, X2, X3 


Variable dependiente: comp 


Límites IC 95% 


Parámetro Inferior | Superior Tolerancia 


Intersección 4 0.168 1.118 0.4406 
voca a 0.168 1.118 0,4406 
inte . 0.130 1.207 0.3017 
adap . 2.875 0.001 0,4229 


— La constante (6 y 123) es el valor que toma la variable de respuesta comp cuando todas las variables 
explicativas son igual a cero y representa un punto, situado a -3.481 unidades en la escala de la 
variable de respuesta, donde el hiperplano de regresión intercepta con el eje de la variable de 
respuesta. Si los tres predictores incluidos se centran (o sea, se restan de sus respectivas medias), 
el valor de la constante es la media de la variable de respuesta. 


— El coeficiente de regresión parcial para voca (Py1.23) es la pendiente del hiperplano correspon- 
diente al eje del predictor X¡ y supone un incremento de 0.643 unidades en la escala de la variable 
de respuesta por cada unidad de incremento en el predictor, manteniendo constantes los restan- 
tes predictores X, y X3. 


— El coeficiente de regresión parcial para inte (Py> 13) es la pendiente del hiperplano correspondien- 
te al eje del predictor X> y supone un incremento de 0.668 unidades en la escala de la variable de 
respuesta por cada unidad de incremento en el predictor, manteniendo constantes los restantes 
predictores X] y X3. 


— El coeficiente de regresión parcial para adap (Py3.12) es la pendiente del hiperplano correspon- 
diente al eje del predictor X3 y representa una disminución de 1.437 unidades en la escala de la 
variable de respuesta por cada unidad de incremento en el predictor, manteniendo constantes los 
predictores X] y X». 


Los estimadores de los coeficientes de regresión parcial estandarizados, o coeficientes Beta, para 
voca (X1), inte (X») y adap (X3) son, aplicando la ecuación 2.16, 


2e /1089.333 

By1023 7 0.643 1517.958 = 0.5448 

as 1240.958 

Bro 13 == 0.668 1517.958 = 0.6043 

E 123.958 

By3 12 = —-1.437 1517.958 = -0.4105 
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y su interpretación es obvia. Para el primer coeficiente de regresión parcial tipificado, un incremento en 
una unidad típica de voca produce un incremento de 0.545 unidades típicas en la variable de respuesta, 
manteniendo constantes inte y adap. Parece que el incremento más importante es el de la variable inte, 
que es muy similar en magnitud al de voca y ambos estadísticamente significativos, mientras que el 
incremento de adap es negativo y de menor magnitud y se encuentra en el nivel de significación límite. 
Aunque se trata de un tema controvertido, para muchos las diferencias en magnitud en los coeficientes 
de regresión estandarizados dan una idea aproximada de la importancia relativa de los predictores al 
margen del nivel de significación. 

En ocasiones resulta también instructivo visualizar un gráfico conjunto de los estimadores tipifica- 
dos y no tipificados como el que muestra la figura 2.3, que representa un GRÁFICO FORESTAL (forest plof) 
donde es posible valorar que las diferencias conciernen principalmente al predictor adap. 


DIG 
0.60 


inte - 


voca - ES 


adap - ÁS A 


bo=-3.48, R?=0.672, F=13.64***, AIC= 150.91 
3 2 A 0 1 
Estimates 


Figura 2.3. — Modelo [X1, X2, X3] con estimadores tipificados (debajo) y no tipificados (encima). 


Por su parte, los valores de tolerancia pueden obtenerse, para un predictor X;, utilizando la fórmula 


(MC) 


= =I37 (2.27) 
(SCHB 


OL; 


donde MCr = 24.918 es la media cuadrática residual del modelo [X1, X2, X3] (véase salida 2.12) y SC;, £; 
yÚ6 ¡Son respectivamente la suma de cuadrados corregida (véase salida 2.2), el valor de 1 y el coeficiente 
de regresión parcial no estandarizado (véase salida 2.13) para el predictor X;. Así, el valor de tolerancia 
para voca (X1) es TOL; = (24.918 x 2.8732)/(1089.333 x 0.643?) = .4406. A partir de estos resultados, los 
coeficientes de determinación semiparciales pueden obtenerse aplicando la ecuación 2.20. 
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B. Análisis de varianza del modelo [X1,X2, X3] 


La descomposición de la variación de la variable de respuesta producida por el modelo de regresión 
múltiple [X1, X2, X3] se muestra en la salida 2.14, y distingue dos partes independientes: una parte ex- 
plicada por el modelo (SC = 1019.591) y otra no explicada por el modelo (SCz = 498.367). La suma de 
las dos SC es igual a la SC7 = 1517.958. La razón F para el modelo prueba que el conjunto de predictores 
especificados (voca, inte y adap) resulta significativo con F(3,20) = 13.639; P < .001. La SCyy se descom- 
pone ahora en tres componentes, uno para cada uno de los predictores, mostrando la existencia de un 
importante efecto para voca, F(1,20) =7.968;P =.011, y para inte, F(1,20) = 6.711; P =.017, y un efecto 
dudoso de adap, cuya probabilidad representa el valor límite de significación, F(1,20) = 4.342; P =.050. 


SALIDA 2.14 

Análisis de varianza del modelo [X1, X2, X3] 

SC tipo HI MC 
1019.591% 339.864 
198.555 198.555 
167.218 167.218 
108.200 108.200 
498.367 24.918 
1517.958 
4 R cuadrado = 0.672 (R cuadrado corregida = 0.622) 


Fuente 


Modelo 
voca 
inte 
adap 

Residual 

Total 


El cuadro 2.5 muestra la descomposición de la variación y las fórmulas de cálculo para obtener las 
cantidades básicas (las sumas cuadráticas representadas con dígitos, SCy con [1], SCc con [2] y SCp con 
[3]) y las sumas de cuadrados del análisis de varianza (expresadas con los símbolos SCr, SCy y SC). La 
ecuación general del modelado argumenta que SC7 = SCy + SCp, o sea, 1517.958 = 1019.591 + 498.367. 
La última parte del cuadro 2.5 descompone la variación explicada por el modelo (SCy = 1019.591) 
en tres componentes específicos para cada predictor, en concreto, SC; (voca) = 198.555, SC2(inte) = 
167.218 y SCz(adap) = 108.200. Como en la regresión con dos predictores, la mejor forma de obtener 
esta descomposición consiste en aplicar el ajuste condicional entre modelos que difieren en la inclusión 
de un predictor extra. 


CUADRO 2.5 
Descomposición de la variación y fórmulas de cálculo para el modelo [X1, X2, X3] 


Cantidades básicas Procedimiento de cálculo No términos 

Corrección media 1] = NY = 5075.042 1 
Valores observados [21= Y Y? = 6593 N=24 
Valores estimados [3] = Y bs = 6094.633 p+1=4 

Sumas de cuadrados Procedimiento de cálculo Grados de libertad 
SC Total (SCy) SCr =[2]- [1] =1517.958 gly=24-1=23 
SC Modelo (SC py) SCy = [3] — [1] = 1019.591 glm=3 
SC Residual (SCp) SCr = [2] - [3] = 498.367 glrp=24-4=20 
Componentes del modelo Procedimiento de cálculo Grados de libertad 
SC voca (SC1) SC = 198.555 (ajuste condicional) | gli =1 
SC inte (SC>)) SC» = 167.218 (ajuste condicional) | glp =1 
SC adap (SC3) SC3 = 108.200 (ajuste condicional) | gl3=1 
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Una formula más sencilla, aunque más propensa a errores de redondeo, para calcular las SC de los 
componentes específicos de cada predictor consiste en utilizar una ecuación equivalente a la ecuación 
2.24, pero evitando la dificultad de trabajar con los coeficientes de determinación semiparciales con 
más de dos predictores, mediante: 


SC; =(SCIABF y TOL)) (2.28) 


donde, para un predictor X;, Pis, y, es el coeficiente de regresión parcial tipificado y TOL; es el valor 
de tolerancia, definido como el complemento del coeficiente de correlación múltiple del predictor X; 
con los restantes predictores del modelo especificado. Ambos se muestran en las dos últimas columnas 
de la salida 2.13. Así, el componente explicado por voca es SC¡ = (1517.958) (0.5448?) (0.4406) = 198.555, 
el explicado por inte es SC), = (1517.958) (0.6043) (0.3017) = 167.218 y el explicado por adap es SCz = 
(1517.958) (-0.41053) (0.4229) = 108.200. Cabe notar que la suma de las SC explicadas por los tres pre- 
dictores no es igual a la SC explicada por el modelo en su conjunto, 1019.591 4% (198.555 + 167.218 + 
108.200) = 473.973, debido al problema de la multicolinealidad (véase sección 2.7). 


C. Ajuste global del modelo [X1,X2, X3] 


La salida 2.14 aporta toda la información sobre el ajuste global relativo del modelo de regresión 
múltiple [X1, X2, X3]. En general, todos los indicadores de ajuste global relativo coinciden en apuntar 
que este modelo es también apropiado. 


— El estadístico F prueba si el modelo difiere significativamente del modelo nulo. O sea, si los pre- 
dictores especificados en el modelo de regresión múltiple [X1, X2, X3] son en conjunto estadís- 
ticamente significativos, o similarmente si la proporción de varianza explicada por el modelo es 
estadísticamente significativa. El resultado de la prueba, F(3,20) = 13.639; P < .001, revela que en 
conjunto los predictores del modelo de regresión múltiple (o la proporción de varianza explicada 
por el modelo) son estadísticamente significativos. 


— El coeficiente de determinación es Ln = RE ys 0.672, e indica que más del 67% de la varianza 
muestral ¡de comp resulta explicada por la combinación de los predictores voca, inte y adap. El 
coeficiente de determinación es un índice muestral y no debe ser utilizado como índice de mag- 
nitud del efecto. Para ello es más aconsejable emplear el coeficiente de determinación ajustado, 
que corrige el sesgo muestral del coeficiente de determinación y suele ser en general igual o más 
pequeño. Para este ejemplo, el coeficiente de determinación ajustado (R?. = 0.622) se desvía en 
50 milésimas del coeficiente de determinación no ajustado, lo que revela un ligero desequilibrio 
entre tamaño muestral y número de predictores. Obsérvese que, dado un tamaño muestral cons- 
tante, el incremento en el número de predictores deteriora el poder explicativo del modelo. 


— El error típico de estimación o predicción (Sp) es la desviación típica de la distribución muestral 
(homocedástica) de los valores ajustados, y es igual a la raíz cuadrada de la Media Cuadrática 
Residual o Error Sg = v24.918 = 4.992, con 20 grados de libertad residuales. Nótese que Sp para el 
modelo [X1, X2, X3] es sensiblemente inferior a la del modelo con dos predictores, Sr[X1, X2] = 
5.374, con 21 grados de libertad residuales, éste a su vez es ligeramente inferior al del modelo con 
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un predictor, Sr[X1] = 5.557, con 22 grados de libertad residuales, y sensiblemente inferior al del 
modelo nulo, Sr[0] = 8.124, con 23 grados de libertad. Respecto del modelo nulo, el porcentaje 
de reducción producido es de 100 x (8.124 — 4.992)/8.124 = 38.6%. Obviamente, cuanto más bajo 
es Sr mejor es la predicción y el ajuste del modelo, pero se percibe un salto importante desde el 
modelo nulo al modelo [X1] y un salto de magnitud similar desde éste a los modelos [X1, X2] y 
[X1, X2, X3]. 


Recuérdese que un modelo ajustado no debe ser interpretado si no son estadísticamente significa- 
tivos tanto la prueba F de ajuste global para el modelo (o la proporción de varianza explicada) como 
todas las pruebas F de sus componentes específicos. En este caso, la salida 2.14 revela que todos los 
componentes del modelo son estadísticamente significativos, por lo que este modelo puede aceptarse 
tentativamente como modelo óptimo. 


D. Ajuste condicional del modelo [X1,X2, X3] 


Si se tienen dudas acerca de la significación de alguno/s de los componentes del modelo la mejor op- 
ción es emplear la estrategia de ajuste condicional y someter a prueba la significación estadística de un 
predictor particular o de un conjunto específico de predictores del modelo de regresión múltiple. Como 
es preceptivo el ajuste condicional define primero un modelo aumentado, que incluye un determinado 
conjunto de predictores que se asume aceptablemente ajustado, y un modelo restringido, que excluye 
uno (o más) de los predictores del modelo aumentado. La prueba obtiene una razón F utilizando como 
numerador la razón entre la diferencia en las SC y la diferencia en los g/g entre ambos modelos y como 
denominador la razón entre la SCz y glp del modelo aumentado. 

Supongamos que se desea probar la significación de un predictor específico, por ejemplo adap (X3), 
con q =.5. En este caso, el modelo [X1, X2, X3] se define como modelo aumentado (modelo 2) y el 
modelo [X1, X2], con todos los predictores exceptuando adap, como modelo restringido (modelo 1). La 
SCr del modelo [X1, X2, X3] es SC = 498.367, y la del modelo [X1, X2] es SCp = 505.567. El resultado 
del ajuste condicional se muestra en la salida 2.15 y permite inferir que el predictor adap se encuentra 
en el límite de la significación estadística: 


108.200/1 
F(1,20) = ==-— =4.342;P <.05 
498.367/20 
Nótese que este resultado es exactamente el mismo que ofrece la salida 2.14 para probar la signifi- 
cación del predictor adap, con SCz = 108.200. Del mismo modo se procede para evaluar la significación 
de voca, con SC; = 198.555, en cuyo caso el modelo restringido es el modelo [X2, X3] (salida 2.16) y de 
inte, con SC» = 167.218, en cuyo caso el modelo restringido es el modelo [X1, X3] (salida 2.17). Los dos 
predictores resultaron también estadísticamente significativos. 


SALIDA 2.15 
Ajuste condicional de los modelos [X1, X2] y [X1, X2, X3 
Modelo 1: comp= 1 + voca + inte 
Modelo 2: comp= 1 + voca + inte+ adap 


Modelo SCr ASCr 


1: [X1,X2] 606.567 
2:[X1,X2,X3] | 498.367 108.200 
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SALIDA 2.16 
Ajuste condicional de los modelos [X2, X3] y[X1, X2, X3] 


Modelo 1: comp= 1 + inte + adap 


Modelo 2: comp= 1 + voca + inte+ adap 


Modelo SCr ASCR 
1: [X2,X3] 696.922 


2:[X1,X2,X3] | 498.367 198.555 


SALIDA 2.17 
Ajuste condicional de los modelos [X1, X3] y [X1, X2, X3] 
Modelo 1: comp= 1 + voca+ adap 
Modelo 2: comp= 1 + voca + inte+ adap 
Modelo SCr ASCR 
1: [X1,X3] 665.585 


2: [X1,X2,X3] | 498.367 167.218 


Así se procede cuando el ajuste condicional implica un único predictor. Pero también es posible 
probar el ajuste condicional de un conjunto de predictores, por ejemplo los predictores inte y adap 
para un nivel de significación prefijado (a = .05). En este caso, el modelo [X1, X2, X3] es el modelo 
aumentado (modelo 2) y el modelo [X1], con el predictor voca, el modelo restringido (modelo 1). El 
modelo [X1] se ajustó anteriormente y produjo una SCr[X1] = 679.264. El ajuste condicional entre los 
dos modelos, que se detalla en la salida 2.18, demuestra que los predictores inte y adap son en conjunto 
estadísticamente significativos, ya que F(2,20) = (180.897/2)/(498.367/20) = 3.630; P =.045. 


SALIDA 2.18 
Ajuste condicional de los modelos [X1] y [X1, X2, X3] 
Modelo 1:comp= 1 + voca 
Modelo 2: comp= 1 + voca + inte+ adap 
Modelo SCr ASCR 
1: [X1] 679.264 


2:[X1,X2,X3] | 498.367 180.897 


2.6. EVALUACIÓN DE UN MODELO DE REGRESIÓN 


La interpretación de los parámetros de un modelo de regresión, y por extensión de un modelo LM, 
descansa sobre el cumplimiento de ciertos supuestos acerca del comportamiento de los errores o re- 
siduales del modelo. Aunque no es una práctica común en la investigación publicada, es importante 
inspeccionar, de forma gráfica o mediante una prueba inferencial, la validez de los supuestos que fun- 
damentan la aplicación de un modelo de regresión (véase Fox y Weisberg, 2011; Weisberg, 2014). Muchas 
de las funciones diagnósticas gráficas e inferenciales más comunes se incluyen en los paquetes estadís- 
ticos profesionales. Los supuestos básicos que debe satisfacer un modelo de regresión son: 


1. NORMALIDAD. Se asume una distribución normal para los errores residuales. La distribución nor- 
mal es un requisito importante para los procedimientos derivados del LM, pero sólo se requiere 
para la inferencia, no para el proceso de estimación y ajuste. Para probar este supuesto, la prueba 
estadística más común es el TEST DE NORMALIDAD SW DE SHAPIRO-WILKSs. Para el modelo [X1], 
SW = 0.950, P = .274, lo que permite aceptar la hipótesis nula de normalidad. 
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2. HOMOCEDASTICIDAD, HOMOGENEIDAD DE LAS VARIANZAS O VARIANZA CONSTANTE. La varianza de 
los residuales se asume constante para todos los valores del predictor X, (voca): 


V(e¡IX) = ElY; — Bo— B1X1)% = Ele?) = 0% (2.29) 


Este supuesto es muy importante en los modelos LM y su violación constituye un problema deno- 
minado HETEROCEDASTICIDAD. Una prueba apropiada para evaluar el supuesto de homocedas- 
ticidad es el TEST NCV DE FOX-WEISBERG, que prueba si la varianza es constante (Hp) o cambia 
con los valores ajustados (H;). Para el modelo [X1], NCV = 0.468; P = .494, lo que también permi- 
te aceptar la hipótesis nula de varianza constante. 


3. INDEPENDENCIA. Las observaciones registradas sobre una muestra de casos se asumen mutua- 
mente independientes. Este supuesto tiene dos aspectos diferentes a destacar. El primer aspecto 
concierne a la INDEPENDENCIA DE LOS RESIDUALES. Dos residuales, e; y cd se asumen mutuamen- 
te independientes cuando su covarianza es C(e;, e;,) = 0 para todo i X 1'. Una de las situaciones en 
que no se cumple este supuesto es cuando dos (o más) residuales consecutivos correlacionan. En 
la investigación psicológica este caso sucede cuando se registran observaciones en el tiempo para 
un mismo sujeto. El problema que genera se denomina CORRELACIÓN SERIAL de los residuales o 
AUTOCORRELACIÓN. La prueba estadística para comprobar si la autocorrelación es cero es el TEST 
DW DE DURBIN-WATSON. Para el modelo [X1], DW = 2.301; P =.718. En general, valores cercanos 
a DW = 2 permiten aceptar la hipótesis de que la autocorrelación es cero. El segundo aspecto, y 
no menos importante, es la INDEPENDENCIA ENTRE LOS RESIDUALES Y LA VARIABLE EXPLICATIVA. 
Se asume que los residuales no correlacionan con el predictor: C(e;, X¡;) = 0. Su violación es grave 
y 9o0suele deberse a la omisión de variables relevantes en el modelo (véase figura 6.3). 


4. LINEALIDAD. Los valores esperados son una función lineal del/los predictor/es: 


pi = E(Y¡) = ElPo+ P1X1¡+€5) 
= Bo+ P1X1; +Elej) (2.30) 
= Po+ P1X1; 


Este supuesto suele formularse también argumentando que la media de los residuales es cero: 
E(e¡) = 0. Por su propia definición, las funciones no lineales no son admisibles en los modelos LM, 
pero muchas funciones de naturaleza no lineal pueden transformarse con facilidad a forma lineal 
mediante alguna función de transformación apropiada. Dada una variable de respuesta (Y), las 
transformaciones más frecuentemente empleadas en Psicología son la de la raíz cuadrada (Y' = 
VY), la logaritmica (Y' = log(Y)) y la recíproca (Y' = 1/Y). 


Además, tiene también interés comprobar la existencia de OBSERVACIONES EXTREMAS, que son casos 
que se desvían mucho del patrón global del diagrama de dispersión. Las observaciones extremas pueden 
ser OBSERVACIONES INUSUALES (outliers) ú OBSERVACIONES INFLUYENTES (influentials). 

Una resumen compacto de estos supuestos suele formularse argumentando que los residuales son 
normal e independiente distribuidos: e; = NID(O, 0?). La figura 2.4 resume los supuestos de linealidad, 
varianza constante y normalidad para el modelo de regresión simple. 
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Figura 2.4. — Supuestos de linealidad, varianza constante y normalidad del modelo de regresión simple. 


Las principales medidas diagnósticas que se emplean comúnmente para evaluar los supuestos de 
un modelo de regresión son las siguientes (véase Fox, 1998, capítulos 11 y 12): 


— Los RESIDUALES ESTANDARIZADOS (standardized residuals) son errores residuales que se han con- 
vertido a valores tipificados de una distribución normal, y los RESIDUALES DE STUDENT ('studenti- 
zed residuals') son residuales tipificados de una distribución t de Student. Con el modelo [X1], al 
nivel a =.05%, y con g!g = 22 grados de libertad, los valores críticos para considerar inusual una 
observación son +1.96 para los residuales a escala normal y +2.07 para los residuales a escala de 
Student. Las observaciones inusuales tienen altos residuales en la variable de respuesta, pero no 
necesariamente son observaciones que influyan en el ajuste. 


— Los PESOS DE PRONÓSTICO (PP, hat-values o leverages) son los pesos que cada observación tiene 
sobre el ajuste. La recta de regresión pasa por un punto, denominado centroide, que corresponde 
a la media del predictor y de la respuesta y actúa como un fulcro. Las observaciones cercanas a 
la media del predictor tienen un peso de pronóstico menor que las que se encuentran más ale- 
jadas. El valor medio del peso de pronóstico es PP = q/N = 2/24 = 0.08, donde q se refiere al 
número de parámetros. Los pesos que se encuentran situados a una distancia 3 veces mayor que 
su valor medio (o sea, que tienen PP > 3q/N > 0.25) detectan puntuaciones extremas altamente 
sospechosas, pero no necesariamente detectan puntuaciones influyentes. Solamente cuando una 
observación es inusual (o sea, tiene un alto residual en la variable de respuesta) y tiene también 
un alto peso de pronóstico (o sea, se aleja considerablemente de la media del predictor), puede 
considerarse una observación influyente, porque tiene un impacto determinante sobre el ajuste. 


— LAS DISTANCIAS DE COOK (DC, Cook's distances) son medidas diagnósticas que se proponen es- 
pecíficamente para detectar puntuaciones influyentes. Representan, para cada observación, el 
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cambio que se produciría en el ajuste si tal observación se eliminara. Un valor de referencia para 
considerar altamente influyente una puntuación en el modelo [X1] es DC > 4/(N — q) > 0.18. 


El cuadro 2.6 muestra, para cada caso, los errores residuales, los residuales tipificados a escala nor- 
mal y a escala de Student, los pesos de pronóstico y las distancias de Cook para la detección de puntua- 
ciones extremas en el modelo [X1] . Nótese que los residuales no detectan ninguna observación inusual 
y que entre los pesos de pronóstico no hay medidas superiores a 0.25, pero en las distancias de Cook se 


observa un observación influyente para el caso 2 (D = 0.3389 > 0.18). 


CUADRO 2.6 
Medidas diagnósticas para el modelo [X1] 


Residual a 


escala normal 


Residual a 
escala Student 


Pesos de 


pronóstico 


Distancias 
de Cook 


VO JO 0U0M+*BO0NAOS 


N NN DN DN RR A A a a 
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Por su parte, la figura 2.5 muestra un conjunto básico de cuatro gráficos diagnósticos para el modelo 
[X1] que se obtuvo con el programa R. El gráfico superior izquierdo (Residual vs Fitted) muestra los erro- 
res residuales contra los valores estimados. Los círculos del gráfico deben distribuirse aleatoriamente en 
torno a la linea horizontal que representa un error residual de cero, sin presentar ninguna tendencia o 
forma claramente discernible. La situación ideal se representa como una recta en torno al valor 0, pero 
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la tendencia muestra una suave forma ondulada. Algo similar, pero con una escala diferente, muestra el 
gráfico inferior izquierdo (Scale-Location). En este gráfico aparece también una suave tendencia, princi- 
palmente causada por los casos 11, 9 y 2. El gráfico superior derecho es un gráfico de probabilidad para 
evaluar la normalidad de la distribución de los residuales (Normal Q-Q). Idealmente, los círculos deben 
situarse sobre la linea de puntos. Sin embargo, se observa un desplazamiento moderado de los casos 11 
y 9, que se destacan en ambos extremos del gráfico. El gráfico inferior derecho (Residual vs Leverage), 
es un gráfico similar al gráfico superior izquierdo, que también muestra los residuales tipificados contra 
los pesos de pronóstico, pero precisando los límites (en los ángulos superior e inferior derecho) fijados 


por las distancias de Cook, que no se sobrepasan en ningún punto. 
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Figura 2.5. — Gráficos diagnósticos de evaluación del modelo [X1]. 
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2.7. EL PROBLEMA DE LA MULTICOLINEALIDAD 


En la salida 2.14 se presentó el análisis de varianza del modelo de regresión múltiple [X1, X2, X3]. 
Una característica crucial de esta salida es que las sumas de cuadrados que utiliza son SUMAS DE CUA- 
DRADOS TIPO III o PARCIALES, que explican porciones de variación única o específica de cada predictor, 
descartando la variación común o compartida entre los predictores. 

Una forma alternativa de presentar el análisis de varianza para el mismo modelo consiste en utilizar 
SUMAS DE CUADRADOS TIPO 1 O SECUENCIALES, que explican porciones de varianza de forma jerárquica o 
secuencial. Existe otro tipo de sumas de cuadrados, denominada SC tipo II, que se recomienda emplear 
con modelos ANOVA y ANCOVA (Langsrud, 2003), pero con modelos de regresión es equivalente a la SC 
tipo III. La salida 2.19 es el análisis de varianza resultante de aplicar las SC tipo 1 al modelo [X1, X2, X3]. 
Obsérvese que la variación explicada por el modelo (SCyy) y el componente residual (SCg) son los mis- 
mos que en la salida 2.14, pero la variación explicada por cada uno de los predictores es radicalmente 
diferente, no resultando significativa en este caso la porción de variación explicada por la variable inte, 
F(1,20) = 2.917;P =.103. 


SALIDA 2.19 
Análisis de varianza del modelo [X1, X2, X3] con SC tipo I 


Fuentes | SC tipolIII MC 

Modelo 1019.591 3 | 339.864 
voca 838.694 838.694 
inte 72.697 72.697 


adap 108.200 108.200 
Residual 498.3673 8.545 
Total 1517.958 
R cuadrado = 0.672 (R cuadrado corregida = 0.622) 


La salida 2.20 muestra ahora el análisis de varianza del modelo de regresión múltiple [X2, X3, X1], 
o sea, el modelo de regresión con los mismos predictores pero con un orden diferente. Si se compara 
con las salidas 2-14 y 2.19 observará que el modelo en su conjunto y el componente residual también 
producen las mismas sumas de cuadrados, pero la variación explicada por cada componente es distinta 
a las anteriores, no resultando ahora significativa la porción de variación explicada por la variable adap. 


SALIDA 2.20 
Análisis de varianza del modelo [X2, X3, X1] con SC tipo I 


Fuentes | SC tipolII MC 
Modelo 1019.591 339.864 
inte 742.330 742.330 
voca 78.706 78.706 
adap 198.555 198.555 
Residual 498.367 8.545 
Total 1517.958 
R cuadrado = .672 (R cuadrado corregida = .622) 


Las diferencias que muestran las tres salidas (2.14, 2.19 y 2.20) con el mismo modelo de regresión han 
de tenerse muy en cuenta porque, como sucede en este ejemplo, pueden producir inferencias distintas 
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si no se advierte al lector qué tipo de SC se está usando. Esta cuestión es lo que se ha denominado 
PROBLEMA DE LA MULTICOLINEALIDAD, y se presenta en modelos de regresión con dos o más predictores 
correlacionados. 

La figura 2.6 (Cohen, Cohen, West y Aiken, 2003, p. 72; Kline, 2011, p. 30) detalla gráficamente la 
composición de la variación utilizando dos predictores para facilitar la comprensión de los conceptos 
mediante diagramas de Venn. Sean X] y X2 dos predictores correlacionados (o sea, colineales) e Y la 
variable de respuesta. En el diagrama de Venn los círculos representan proporciones de variación y el 
grado de solapamiento entre círculos representa la proporción de varianza que explican. 


sCtipol XI x2 
SC(XI)=a+c 
SC(X2/X1)=b 


SC tipo | 
SC(X2)=b+c Ri, = a+c 


SC(X1|X2)=a 


SC tipo lIl R3= c+d 
SC(X1)=a 
SC(X2/X1)=b 
Y 1-R? 
SC tipo Il y 
SC(X2)=b at a 
SC(X1|X2)=a Y .12 y2 Y (12) 

2 2 2 
b=R; y Ry, = Rex 


Figura 2.6. — Composición de la varianza con dos predictores colineales. 


Supongamos que el investigador establece un orden de entrada, por ejemplo, primero X, y después 
X>. En tal caso, la atribución de la variación de Y explicada por los predictores con SC tipo I sigue el 
siguiente proceso: la primera variable en entrar (X¡) se atribuye toda la variación de Y que explica de 
forma única X; (área a) más la variación de Y que comparten X; y X» (área Cc), mientras que la segunda 
variable en entrar (X>) se atribuye solamente la varianza de Y que explica de forma única X» (área b), 
ya que la varianza que comparten en común ya fue atribuida a X, y no puede atribuirse de nuevo a 
ningún otro predictor. Es decir, cuando los predictores X¡ y X2 presentan algún grado de correlación, 
la varianza de Y compartida conjuntamente por X1 y X, se atribuye a la primera variable introducida 
(X1), pero no a la segunda (X>). En conjunto, los dos predictores incluyen toda la variación de Y por 
explicar (en el diagrama, a+ b+ c). Obviamente, la atribución de la variación de Y para cada predictor 
habría sido distinta si se hubieran introducido primero X> y después X/, pero la variación de Y explicada 
por los dos predictores sería también a+ b+ c. En consecuencia, utilizando SC tipo 1 en presencia de 
colinealidad, la variación explicada por cada predictor depende del orden de entrada. A la derecha del 
diagrama de Venn de la figura 2.6 se muestran todos los posibles coeficientes de determinación y debajo 
una definición de las porciones a y b como coeficientes de determinación semiparciales. 
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La figura 2.7 utiliza por el contrario dos predictores independientes, o sea, no colineales. Cuando los 
dos predictores no correlacionan, la porción de la variación de Y que se atribuyen X, y Xz no depende 
del orden de entrada de las variables, ya que el predictor X, se atribuye una parte de la variación de 
Y que no tiene nada en común con la parte de la variación de Y que se atribuye al predictor X2. En 
consecuencia, no existe variación compartida por los dos predictores cuando se trata de predictores no 
correlacionados. El gráfico muestra la redefinición de todas las áreas del diagrama de Venn a partir de 
los coeficientes de determinación. 


Xl Xx2 
2 _ 
SC tipo | R,= 4 
SC(XI)=a R.<=b 
SC(X2]X1)=b y 
Ro =0 
SC tipo III Ñ 
SC(XI)=a Y Ry, = a+b 
SC(X2/X1)=b a 
2 2 2 ae E 
a=Ry 12 = Ryo = Rras) 
2 2 2 
b=R; 1) Ry, = Ryos) 


Figura 2.7. — Composición de la varianza con dos predictores en ausencia de colinealidad. 


El problema que se plantea entonces es el tratamiento de las sumas de cuadrados con predictores 
correlacionados. El término colinealidad suele utilizarse cuando solamente hay dos predictores, como 
asumimos en las figuras 2.6 y 2.7, pero el concepto se generaliza al caso de más de dos predictores, en 
cuyo caso se utiliza el término multicolinealidad. 

Para muchos autores es sin duda problemático que la magnitud de la variación de la variable de 
respuesta explicada por un modelo compuesto de un conjunto de predictores se atribuya de forma di- 
ferente en función del orden de entrada de los predictores. Cualquier cambio que se produzca en tal 
ordenación provocará cambios en la magnitud de la varianza explicada por cada uno de los predictores. 
Esto es lo que sucede con predictores colineales cuando se emplean SC tipo l, como se observa en las 
salidas 2.19 y 2.20. Sin embargo, un rasgo muy deseable de las SC tipo I es que si se suman todas las 
porciones de SC explicada por cada uno de sus componentes, el resultado es exactamente igual a la SC 
explicada por el modelo en su conjunto. Así sucede con la salida 2.19, donde se cumple que 1019.591 = 
838.694 + 72.697 + 108.200, y también con la salida 2.20, donde 1019.591 = 742.330+ 78.706 + 198.555. 

Para soslayar este problema, muchos autores sugieren utilizar siempre SC tipo III, que permite atri- 
buir la variación de la variable de respuesta explicada por cada predictor sin tener en cuenta la variación 
compartida por los predictores, y por tanto no dependiendo del orden de entrada. Para un predictor 
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determinado, las SC tipo III son exactamente las que se obtendrían con SC tipo 1 si el predictor consi- 
derado entrara en último lugar en el modelo, es decir, cuando ya se ha atribuido toda la variación de la 
variable de respuesta compartida por el conjunto de los predictores, y por tanto representan contribu- 
ciones únicas y exclusivas de cada predictor, como si fueran predictores independientes. 

Es importante notar que las SC tipo III son las que reportan automáticamente la mayoría de los 
paquetes estadísticos profesionales (p.e., SAS, SPSS y STATA), pero otros paquetes con gran tradición 
estadística reportan por defecto las SC tipo 1 (p.e., GENSTAT y R). En parte, esta discrepancia se debe 
a que con modelos de regresión las SC tipo III se corresponden directamente con los coeficientes de 
regresión parcial métricos, que evalúan el efecto de un predictor, manteniendo constantes todos los de- 
más, y con los coeficientes de determinación semiparciales, que atribuyen una proporción de varianza 
única a cada predictor. Debido a esta correspondencia, con un grado de libertad en el numerador, la 
razón F para cada predictor de un modelo (o sea, con un grado de libertad en el numerador) es igual al 
cuadrado de la prueba t, es decir: F= t?. Compruébese la coincidencia de los valores de probabilidad 
asociados a las pruebas í para los coeficientes de cada predictor (salida 2.13) con los de las SC tipo III 
explicadas por cada predictor (salida 2.14). Salvando errores de redondeo, los valores 1? de la salida 2.13 
son iguales a los valores de F de la salida 2.14: (2.823)? = 7.968, (2.590)? = 6.711 y (-2.084)? = 4.343. Y da- 
da la equivalencia de la información ofrecida, los partidarios de las SC tipo I consideran una alternativa 
conveniente reproducir la salida del análisis de varianza con SC tipo l. 

Obviamente, un rasgo indeseable de las SC tipo TIT es que, cuando existe multicolinealidad, la suma 
de todas las SC explicadas por cada predictor no es igual a la SC explicada por el modelo, o sea, difie- 
ren de la SC explicada por el modelo en su conjunto. En la salida 2.14, las contribuciones específicas 
en SC de los predictores son SC; + SC, + SC3 = 198.555 + 167.218 + 108.200 = 473.973, pero la SC expli- 
cada por el Modelo es SCy = 1019.591. La diferencia, 1019.591 — 473.973 = 545.618, o sea, casi un 54% 
(545.618/1019.591=.534), es variación de la variable de respuesta compartida en común por el conjun- 
to de los predictores, y representa una parte de variación que se desprecia cuando se utilizan SC tipo 
TI. Para muchos investigadores, esta variación despreciada en salidas con SC tipo III no es objeto de 
atención ni de justificación, y resulta incluso inquietante para los partidarios de emplear SC tipo 1. 

En conclusión, ambas SC tienen sus ventajas e inconvenientes, sus partidarios y sus detractores, lo 
que ha llevado a los paquetes estadísticos profesionales a facilitar a los usuarios la decisión de utilizar 
SC tipo I o tipo TIT. Puesto que los paquetes estadísticos más familiares, pero no siempre los más re- 
comendables (p.e., SPSS), utilizan por defecto SC tipo III, es conveniente no olvidar que, en presencia 
de multicolinealidad, la variación explicada por los componentes de un modelo podría ser interpreta- 
da inadecuadamente si no se tiene en cuenta (y se justifica sustantivamente) la presencia de variación 
compartida en común por los predictores. 

La multicolinealidad representa una magnitud que muchos modelos de regresión pueden tener en 
mayor o menor grado. Cuando se sobrepasa un límite, la multicolinealidad produce problemas en la 
estimación de los parámetros. Para determinar en qué medida un modelo sobrepasa este límite, pueden 
emplearse dos medidas diagnósticas del grado de multicolinealidad de un conjunto de predictores: 


— El VALOR DE TOLERANCIA (T OL), que más arriba definimos como el complemento del coeficiente 
de correlación múltiple de una variable explicativa (p.e., X;) respecto de las demás: TOL;=1- Ri. 


— El FACTOR DE INFLACIÓN DE LA VARIANZA (F IV), que se define como el recíproco del valor de tole- 
rancia: FIV; = 1/TOL). 


La tolerancia puede tomar valores comprendidos entre 0 y 1. En general, cuanto más bajo es el va- 
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lor de tolerancia más alto es el grado de multicolinealidad del predictor considerado, pero valores de 
TOL < 0.100 para un predictor no son aceptables y sugieren que el predictor considerado debería ser 
eliminado del modelo por presentar información redundante. El factor de inflación de la varianza pue- 
de tomar valores entre 1 y +00, pero valores de FIV > 10 tampoco son aceptables y sugieren asimismo 
la eliminación automática del predictor. 

La ecuación 2.27 es una fórmula directa para obtener los valores de tolerancia para el predictor X; 
que utiliza la media cuadrática residual, la suma de cuadrados del predictor X;, el valor de 1 y el coefi- 
ciente de regresión parcial de X;. Los programas de regresión de la mayoría de los paquetes estadísticos 
profesionales informan acerca de los valores de tolerancia (véase por ejemplo la salida 2.13). Salvan- 
do los errores de redondeo, los valores de tolerancia para el modelo [X1, X2, X3] son TOL¡ = 0.4406, 
TOL2 = 0.3017 y TOLz = 0.4229. Los correspondientes factores de inflación de la varianza son FIV, = 
1/0.4406 = 2.270, FIV, = 1/0.302 = 3.311 y FIV3 = 1/0.423 = 2.364. Ninguno de los valores de TOL y de 
FIV para el modelo [X1, X2, X3] sobrepasan los límites recomendados. 


2.8. REGRESIÓN CON VARIABLES CATEGÓRICAS 


Aunque los modelos de regresión están especialmente indicados para operar con variables numéri- 
cas, es también posible incorporar VARIABLES CATEGÓRICAS O FACTORES, medidas en escala nominal u 
ordinal. Los modelos de la estructura LM presuponen que cada variable representa un vector numérico 
(y como tal requiere una única columna de la matriz del modelo). Para operar con un programa de aná- 
lisis de regresión es preciso transformar una variable categórica en un conjunto de vectores numéricos 
para que en conjunto puedan capturar toda la información contenida en tal variable. A este proceso 
de transformación se le denomina CODIFICACIÓN y €s la aplicación de una serie de reglas para utilizar 
códigos numéricos con el objeto de representar la información acerca de la pertenencia de cada caso a 
una de las categorías o niveles del factor. 

La codificación de un predictor categórico o factor utiliza en esencia un conjunto de variables pseudo- 
numéricas, cada una de las cuales representa un CONTRASTE particular entre las medias de los niveles 
del factor. En general, un predictor categórico o factor con a categorías o niveles requiere un total de 
a— 1 variables pseudo-numéricas. El Ejemplo 2.1 contiene dos predictores categóricos o factores, a sa- 
ber: sexo, con dos categorías o niveles ('y', varones y 'm', mujeres) y nsoc, con tres niveles o categorías 
('a', nivel socioeconómico alto, *b', nivel socioeconómico medio y 'c', nivel socioeconómico bajo). En 
consecuencia, para codificar la variable sexo se requieren 2— 1 = 1 variables pseudo-numéricas mien- 
tras que para codificar la variable nsoc se requieren 3-— 1 = 2 variables pseudo-numéricas. 

Aunque existen muchos tipos de codificación, en la investigación aplicada suelen emplearse tres 
tipos básicos. Para factores nominales hay dos sistemas muy extendidos, la CODIFICACIÓN TIPO REGRE- 
SIÓN O CODIFICACIÓN FICTICIA (dummy coding) y la CODIFICACIÓN TIPO ANOVA O CODIFICACIÓN DE 
EFECTOS (effect coding). Para factores ordinales el sistema de codificación más común es la CODIFICA- 
CIÓN ORTOGONAL, que trataremos en el capítulo siguiente. 


2.8.1. Codificación tipo regresión 


La codificación tipo regresión define un vector numérico para cada categoría de la variable, excepto 
una, que por defecto suele ser la última, llamada CATEGORÍA O NIVEL DE REFERENCIA, utilizando ceros y 
unos como códigos numéricos. Por ejemplo, para codificar sexo (Modelo [4)), con dos categorías (hom- 
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bres y mujeres), la codificación tipo regresión requiere un vector, que asigna el código '0' a todas las 
mujeres y el código '1” a todos los varones. Para codificar la variable nsoc (Modelo [B]), con tres cate- 
gorías, se precisan dos vectores (el número de niveles menos uno), donde el primer vector codifica la 
pertenencia al nivel socioeconómico a, asignando unos a todos los sujetos que pertenecen al nivel a 
y cero a los que pertenecen a los niveles b o c, y el segundo vector codifica la pertenencia al nivel b, 
asignando unos a todos los sujetos del nivel b y ceros a los que pertenecen a los niveles a o c. Observe 
que el nivel c no se codifica, siendo el único que recibe ceros en los dos vectores, y por ello representa el 
nivel de referencia. 

Usando codificación tipo regresión, los estimadores de los parámetros del modelo con la variable 
categórica nsoc (Modelo [B]) se muestran en la salida 2.21. Junto al nombre de la variable categórica se 
especifica también el nivel que codifica la pertenencia, en este caso nsoc-a y nsoc-b. Siendo las medias de 
la variable de respuesta comp por grupos: 23.75 (nivel a), 11.625 (nivel b) y 8.250 (nivel c), y utilizando 
como nivel de referencia el nivel c, con codificación tipo regresión el parámetro de intercepción es la 
media de la categoría de referencia (o sea, 8.250), el parámetro nsoca es la diferencia entre las medias de 
los niveles a y c (o sea, nsoca= 23.75 —8.25 = 15.50 y el parámetro nsocb es la diferencia entre las medias 
de los niveles b y c (o sea, nsocb= 11.625 — 8.250 = 3.375). Así, conociendo las medias de los grupos de 
nsoc y dado un nivel de referencia, con codificación tipo regresión se pueden conocer los estimadores 
de los parámetros, haciendo por tanto innecesaria una de las salidas de los modelos de regresión. 


SALIDA 2.21 
Estimadores de los parámetros del modelo [B] con codificación tipo regresión 


Variable dependiente: comp 


Límites IC 95% 
Parámetro Inferior | Superior 


Intersección , 4.828 11.672 
nsoca Ñ 10.661 20.339 
nsocb ] 1.464 8.214 


Conviene no obstante advertir que un modelo con una variable categórica no es en esencia un mo- 
delo de regresión, sino un modelo ANOVA. Los modelos ANOVA representan de hecho una simplifica- 
ción de los modelos de regresión al definir la pertenencia a grupos con vectores codificados. Por esta 
razón, en los modelos ANOVA no es usual presentar la salida sobre estimadores de los parámetros, que 
puede deducirse de las medias, sino solamente la salida del análisis de varianza, en la que se prescin- 
de de los vectores codificados para evaluar el efecto conjunto de la variable nsoc sobre la variable de 
respuesta. Esta misma salida es la que se utiliza también en un modelo de regresión con una variable 
categórica. El análisis de varianza de la salida 2.22 muestra que la variable categórica nsoc es estadística- 
mente significativa: F(2,21) = 24.539; P < .001, pero observe que no aparece información alguna sobre 
los vectores codificados. 


SALIDA 2.22 
Análisis de varianza del modelo [B] con codificación tipo regresión 


Variable dependiente: comp 
Fuentes | SC tipo III 
Modelo 1063.0834 531.542 


nsoc 1063.083 531.542 
Total 1517.958 
4 R cuadrado = 0.700 (R cuadrado corregida = 0.672) 
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2.8.2. Codificación tipo ANOVA 


La codificación tipo ANOVA define también un vector numérico para cada categoría de la variable 
categórica, excepto una, que define el nivel o categoría de referencia, pero la diferencia respecto a la 
codificación tipo regresión es que ahora se emplean los códigos 1, 0 y —1. Se precisa definir primero 
cuál será el grupo de referencia. Si se toma también c como referencia, para codificar la variable nsoc 
con codificación tipo ANOVA, se utilizan dos vectores, el primero de los cuales codifica la pertenencia 
al nivel a utilizando los códigos 1 para el nivel a, O para el nivel b y —1 para el nivel c, y el segundo 
codifica la pertenencia al nivel b utilizando los códigos O para el nivel a, 1 para el nivel b y —1 para el 
nivel c. El resultado se muestra en la salida 2.23. Con codificación tipo ANOVA, la interpretación de los 
parámetros es diferente. La intercepción es ahora la media global de la variable de respuesta (Y = 14.542, 
el parámetro nsoca es la diferencia entre su media y la media global (o sea, 23.75 — 14.542 = 9.208) y el 
parámetro nsocb es la diferencia entre su media y la media global (o sea, 11.625— 14.542 = -2.917). 


SALIDA 2.23 
Estimadores de los parámetros del modelo [B] con codificación tipo ANOVA 


Variable dependiente: comp 


Límites IC 95% 
Parámetro Inferior | Superior 
Intersección , 12.566 16.517 


nsoca á 6.414 12.002 
nsocb y 5.711 0.123 


Puesto que la información de los parámetros puede reproducirse con facilidad si se conocen los 
promedios, el tipo de codificación y la categoría de referencia, el modelo resultante (que es de hecho un 
modelo ANOVA) sólo requiere la información contenida en el análisis de varianza correspondiente que 
se muestra en la salida 2.24. Nótese que el análisis de varianza de la salida 2.24 es exactamente el mismo 
que el de la salida 2.22, y que el tipo de codificación que se elige puede producir diferentes estimadores 
de los parámetros (salidas 2.21 y 2.23, siendo nsocb no significativo en la primera y significativo en la 
segunda), que se interpretan en función de las medias de las categorías, pero no afectan en absoluto a 
la descomposición de la variación. 


SALIDA 2.24 
Análisis de varianza del modelo [B] con codificación tipo ANOVA 


Variable dependiente: comp 
Fuentes | SCtipo III MC 
Modelo 1063.0831 2 | 531.542 


nsoc 1063.083 531.542 
Total 1517.958 
4 R cuadrado = 0.700 (R cuadrado corregida = 0.672) 


2.9. SELECCIÓN DE VARIABLES 


Cuando el investigador se interesa por unos pocos predictores, la especificación de modelos no suele 
plantear ninguna dificultad. Sin embargo, cuando hay muchos predictores se precisan procedimientos 
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que faciliten la tarea del investigador. Dado un conjunto de predictores de interés, se distinguen dos 
procedimientos generales para especificar un modelo de regresión. 


— Mediante la SELECCIÓN SIMULTÁNEA, todos los predictores se tratan por igual y se introducen to- 
dos a un tiempo, como hemos asumido a lo largo de este capítulo. 


— Con la SELECCIÓN SECUENCIAL, en cambio, los predictores se seleccionan siguiendo un orden de 
entrada, usualmente a través de una serie de etapas. Mientras el primero se utiliza con un nú- 
mero manejable de predictores, el segundo es más común cuando se pretende analizar un gran 
número de predictores. En este último caso, el procedimiento más empleado hasta ahora en la 
investigación psicológica es la SELECCIÓN POR PASOS (stepwise regression), donde el computador 
se encarga de seleccionar uno a uno los predictores más significativos de un conjunto en función 
del peso que cada predictor tiene para explicar la variable de respuesta, teniendo en cuenta que 
un predictor introducido en una etapa determinada puede ser eliminado en un paso posterior si 
cambia su poder explicativo por debajo de un límite preestablecido. El proceso puede tener lugar 
definiendo primero un conjunto con todos los predictores y eliminando aquellos que no tienen 
poder explicativo (backward selection o selección retroactiva) o bien partiendo del modelo nulo e 
introduciendo uno a uno los predictores más relevantes de acuerdo con algún criterio preestable- 
cido (forward selection o selección proactiva). 


El procedimiento de selección por pasos es muy controvertido y ha sido duramente criticado (véa- 
se Harrell, 2001; Thompson, 1998; Snyder, 1991). Entre sus limitaciones se han destacado proble- 
mas de sesgo en los parámetros y en R?, una reducción importante en la magnitud de los errores 
típicos, de los intervalos de confianza y de los valores P de probabilidad y un aumento significativo 
de la multicolinealidad. Pero el principal problema reside en el papel central que el procedimien- 
to atribuye al computador y la escasa o nula participación que deja al investigador, obteniendo en 
muchas ocasiones modelos que no son fácilmente integrables en una teoría. 


— Una solución intermedia, mediante un proceso de selección por pasos guiado por el investiga- 
dor, consiste en introducir los predictores de forma jerárquica, fundamentalmente siguiendo la 
lógica de la investigación. El procedimiento se denomina SELECCIÓN JERÁRQUICA (hierarchical se- 
lection) y consta también de una serie de etapas, en cada una de las cuales se introducen uno o 
más predictores (Cohen et al., 2003). Usualmente, en las primeras etapas se introducen variables 
sociodemográficas y otras variables de control, mientras que en las últimas etapas se introducen 
las variables de mayor relevancia para el investigador, con la finalidad de analizar su efecto depu- 
rado de la influencia de las variables de control introducidas en etapas anteriores. En cada etapa 
se calcula el coeficiente de determinación (no ajustado y ajustado, pero todo el proceso descansa 
en el primero), y se determina si el incremento que se produce en el coeficiente de determinación 
de una etapa respecto al de una etapa anterior es estadísticamente significativo. 


Para ilustrar este proceso, realizamos un análisis de regresión jerárquica en dos etapas con algunas 
de las variables del Ejemplo 2.1. Por ejemplo, en la primera etapa se podrían introducir dos variables 
sociodemográficas de naturaleza categórica, el sexo de los niños (variable sexo, que requiere un vector 
numérico codificado) y el nivel socioeconómico de sus familias (variable nsoc, que requiere dos vectores 
numéricos codificados), con el objeto de controlar su efecto. En la segunda etapa se podrían introducir 
las variables numéricas de interés específico para el investigador que se han tratado anteriormente, el 
nivel de vocabulario (voca), de inteligencia (inte) y de adaptación escolar (adap). 
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La salida 2.25 muestra un resumen del proceso de selección jerárquica con los dos modelos cita- 
dos. En el primero de los modelos (M1), las variables sociodemográficas explican más de un 70% de la 
varianza de la variable de respuesta (Sr[M1] = 4.743), mientras que en el segundo (M2) las variables 
sociodemográficas y las variables relevantes explican en conjunto un 78% (Sr[M2] = 4.436) de la va- 
rianza. El incremento en R? que se produce entre ambos modelos es AR? = 0.789 — 0.704 = 0.076, con 
una diferencia de 20— 17 = 3 grados de libertad. Como se observa en la salida 2.25, el coeficiente de 
determinación para el segundo modelo es R? = 0.780, con 17 grados de libertad residuales. Salvando 
errores de redondeo, la correspondiente prueba es simplemente un ajuste condicional (ecuación 2.12), 
F= (0.076/3)/[(1 — 0.780)/17] = 1.954; P =.159, que permite concluir que no hay diferencias significati- 
vas entre los dos modelos. 


SALIDA 2.25 
Resumen del proceso de regresión jerárquica 


Modelo 


Modelo 1: (Constante), sexo, nsoca, nsocb 


Modelo 2: (Constante), sexo, nsoca, nsocb, voca, inte, adap 


La salida 2.26 detalla los estimadores de los parámetros de los dos modelos. Observe la importancia 
de la variable nsoc, particularmente la diferencia entre el primero y el último grupo (vector nsoca) en la 
primera etapa. Esta diferencia se mantiene en la segunda etapa, donde el resto de las variables introdu- 
cidas no son estadísticamente significativas. En la última columna se inserta el factor de inflación de la 
varianza, que apunta en la segunda etapa del proceso problemas de colinealidad próximos al límite en 
el primer vector de la variable categórica, nsoca, y en la variable voca, problemas que no se manifiestan 
en la primera etapa. 


SALIDA 2.26 
Estimadores de los parámetros de los modelos de regresión jerárquica 


Variable dependiente: comp 


Modelo | Parámetro 


1 (Constante) 
sexo 
nsoca 


nsocb 


(Constante) 
sexo 
nsoca 
nsoch 
voca 


inte 


adap 
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La salida 2.27 muestra el análisis de varianza de los dos modelos de regresión. Observe que ambos 
son significativos, pero el objeto de la regresión jerárquica no es probar la significación de los mode- 
los sino el incremento en variación explicada del segundo respecto del primero. En la salida 2.25 ya se 
demostró que el segundo modelo no difería significativamente del primero: F(3,17) = 1.954; P =.159. 


SALIDA 2.27 
Análisis de varianza de los modelos de regresión jerárquica 


Modelo | Fuentes SC tipo II MC 

1 Regresión 1068.125 356.042 

Residual 449.833 22.492 
Total 1517.958 


Regresión 1183.461 197.243 
Residual 334.498 19.676 
Total 1517.958 


Modelo 1: (Constante), sexo, nsoca, nsocb 


Modelo 2: (Constante), sexo, nsoca, nsocb, voca, inte, adap 


A la vista de estos resultados, puede concluirse que el efecto de las variables voca, inte y adap no 
aporta nueva información a la información obtenida con las variables categóricas sexo y nsoc. El in- 
vestigador debe reflexionar sobre este resultado y someter a prueba otros modelos de interés que no 
comprometan la multicolinealidad. Por ejemplo, probablemente podría justificarse desde una perspec- 
tiva sustantiva la introducción de la variable categórica nsoc en la primera etapa y la variable inte en la 
segunda, prescindiendo de todas las demás variables. Si así fuera, el resumen de los dos modelos resul- 
tantes se muestra en la salida 2.28 y apunta que el incremento en R? del segundo modelo respecto del 
primero es ahora estadísticamente significativo, F[(0.069/1)/(0.770/20)] = 6.035; P =.023. 


SALIDA 2.28 
Resumen del proceso de regresión jerárquica 


Modelo 


Modelo 1: (Constante), nsoca, nsocb 
Modelo 2: (Constante), nsoca, nsocb, inte 


2.10. MODELOS DE MEDIACIÓN Y MODERACIÓN 


Cuando se explora el efecto de un predictor (X) sobre una respuesta (Y) en general no suele va- 
lorarse el papel que otras variables (llamadas en general TERCERAS VARIABLES O VARIABLES Z) podrían 
ejercer sobre tal efecto. Pero hay varias formas en que las terceras variables podrían intervenir sobre 
una relación entre las dos variables básicas (véase Ato y Vallejo, 2011). Dos tipos de relación con terceras 
variables, que en su forma más simple se ajustan con modelos de regresión múltiple pero que se han 
generalizado a modelos más complejos de las estructuras GLM, LMM y sobre todo SEM, juegan un 
papel esencial en la investigación actual en Psicología. Son los modelos de mediación y moderación, que 
en su forma más simple ilustramos brevemente a continuación. 
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2.10.1. Modelos de mediación 


Uno de los posibles papeles que puede desempeñar una tercera variable en la relación entre una va- 
riable explicativa y una variable de respuesta (Y) es el papel de MEDIADOR. La relación que originalmen- 
te X tiene con Y, sin ser mediada por Z, se representa en la parte superior de la figura 2.8 y constituye 
el EFECTO TOTAL (coeficiente c). La relación de X con Y se representa en la parte inferior de la figura 2.8, 
y puede descomponerse en un EFECTO DIRECTO (no mediado por Z, que es igual al coeficiente c') y un 
EFECTO INDIRECTO (mediado por Z, que es igual al producto de los coeficientes a x b). El denominado 
ANÁLISIS DE LA MEDIACIÓN es un procedimiento estadístico para probar la existencia de mediación que 
fue originalmente propuesto por Kenny y colaboradores (Judd y Kenny, 1981b; Baron y Kenny, 1996). Es- 
te es un tema de gran interés para la investigación aplicada (aunque también sometido a controversia), 
a juzgar por el cada vez más abundante número de trabajos de investigación en Psicología que utilizan 
esta técnica analítica. 


Modelo no mediado 


Cc 
pp e 


c= efecto total 
c' = efecto directo 
a*b = efecto indirecto 


AS 


Figura 2.8. — Modelos para el análisis de la mediación. 


Modelo mediado 


En esencia, el análisis de la mediación (MacKinnon, 2007) es una prueba comparativa de los dos 
modelos de la figura 2.8, el modelo no mediado y el modelo mediado, que se basan en la ecuación: 


Efecto total. = Efecto directo + Efecto indirecto (2.31) 


c = Cc + axb 


y consiste en una serie de modelos de regresión para estimar un conjunto de coeficientes con los cuales 
se descompone el efecto total y se interpreta la relación de mediación en una de dos formas posibles. La 
MEDIACIÓN COMPLETA asume que los coeficientes a y b son estadísticamente significativos pero el coe- 
ficiente c' no lo es, concluyendo que X no afecta a Y después de controlar Z y por tanto prácticamente 
todo el efecto total se asume indirecto. La MEDIACIÓN PARCIAL asume también que los coeficientes a y b 
son significativos y el coeficiente c' también, pero se reduce en magnitud, concluyendo que X afecta a 
Y después de controlar Z, y por tanto el efecto total es en parte efecto directo y en parte efecto indirecto. 

En la práctica, para establecer la existencia de mediación estadística, Baron y Kenny (1986) reco- 
miendan seguir las etapas que se especifican a continuación. 
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— Etapa 1: ¿Covarían predictor y respuesta? El primer paso averigua si existe un efecto que pueda 
ser mediado, al que hemos denominado efecto total. La comprobación de este supuesto se realiza 
mediante análisis de regresión simple tomando Y como variable de respuesta y X como variable 
explicativa, y obtiene el coeficiente c de la figura 2.9, que debe ser estadísticamente significativo. 
Para muchos analistas, este paso es innecesario, porque puede darse el caso de que exista media- 
ción sin que el coeficiente c sea significativo (véase Hayes, 2013; Preacher y Hayes, 2004). 


— Etapa 2: ¿Covarían predictor y mediador? La comprobación de este paso se realiza asimismo me- 
diante análisis de regresión simple, pero tomando ahora Z como variable de respuesta y X como 
predictor, y obtiene el coeficiente a de la figura 2.9, que debe ser también significativo. 


— Etapa 3: ¿Covarían mediador y respuesta controlando el predictor? La comprobación de este paso 
se realiza con análisis de regresión múltiple tomando simultáneamente Z y X como predictores 
e Y como respuesta y obtiene el coeficiente b, que debe ser también significativo, y el coeficiente 
c' de la figura 2.8. Es importante señalar que en este paso no es suficiente establecer que Z co- 
rrelaciona con Y porque ambos tienen una supuesta causa común, que es X. Por esta razón, la 
variable X debe ser controlada incluyéndola en este paso junto con Z. 


— Etapa 4: ¿Qué tipo de mediación existe? Si se verifican los tres pasos anteriores puede concluirse 
que Z media la relación entre X e Y; si no se verifican, no puede concluirse que exista mediación. 
La cuestión en este paso es determinar el tipo de mediación. Para ello se observa el cambio pro- 
ducido en el coeficiente c respecto a c”. Silos coeficientes c (que se asume significativo en el paso 
1) y c' (que se obtiene en el paso 3) son ambos significativos, el tipo de mediación sería parcial. Si 
el coeficiente c' no fuera significativo, el tipo de mediación sería completa. 


Los datos del Ejemplo 2.1 pueden servir para ilustrar el análisis de la mediación. Como se ha mos- 
trado en secciones anteriores, las puntuaciones obtenidas en una prueba de vocabulario (X) son deter- 
minantes para explicar la comprensión lectora (Y). El coeficiente c y su correspondiente error típico se 
obtienen de la salida 2.6 (c = 0.877, SE¿ = 0.168) y la prueba £ muestra que es estadísticamente signifi- 
cativo: £(22) = 5.212; P < .001, con lo que se verifica el paso 1. Sin embargo, una cuestión de interés sería 
determinar si la autoestima (Z) es un mediador en tal relación. 

La salida 2.29 corresponde al modelo de regresión simple del paso 2, de donde se toman el coefi- 
ciente a y su error típico (a = 0.369, SE¿ = 0.074). La prueba £ muestra que el coeficiente a es también 
significativo: t(22) = 5.023; P < .001, y por tanto el paso 2 también se verifica. 


SALIDA 2.29 
Estimadores de los parámetros del modelo de mediación (paso 2) 
Variable dependiente: auto 


Límites IC 95% 
Parámetro Inferior | Superior 


Constante Ñ 0.570 5.910 
voca 7 0.217 0.522 


Por su parte, la salida 2.30 corresponde al modelo de regresión múltiple del paso 3, de donde se to- 
man el coeficiente b y su error típico (b = 1.108, SE; = 0.437). La prueba £ muestra que el coeficiente b es 
también significativo: (21) = 2.532; P = .019, y por tanto el paso 3 también se verifica. En este paso tam- 
bién se obtienen el coeficiente c' y su error típico (c' = 0.469, SE¿. = 0.221), que resulta marginalmente 
significativo: t(21) =2.120;P =.046. 
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SALIDA 2.30 
Estimadores de los parámetros del modelo de mediación (paso 3) 


Variable dependiente: comp 


Límites IC 95% 


Parámetro Inferior | Superior 


Constante h 9.467 3.002 
voca Ñ 0.009 0.928 
auto E 0.198 2.017 


Con todos estos resultados el investigador puede adoptar una decisión. Los tres pasos se han verifi- 
cado y por tanto cabe afirmar que existe mediación. El tipo de mediación se determina comparando el 
coeficiente c, que se obtuvo en el paso 1 (sin introducir el mediador), y el coeficiente c', que se obtuvo 
en el paso 3 (una vez introducido el mediador). La sensible reducción del coeficiente (de c = 0.877 a 
c' = 0.469), apunta un efecto de mediación importante, y puesto que c' sigue siendo significativo, puede 
concluirse que se trata de mediación parcial. 

Siendo el efecto indirecto a x b= (0.369) (1.108) = 0.409, la ecuación 2.31 descompone el efecto total 
en sus componentes directo e indirecto: 0.877 (Efecto total) = 0.469 (Efecto directo) +0.409 (Efecto in- 
directo), y la proporción del efecto indirecto o mediado sería la razón del efecto indirecto respecto del 
efecto total, 0.409/0.877 = 0.466, o sea, casi un 47% del efecto total entre vocabulario y comprensión se 
debe a mediación de la variable autoestima. Obviamente, el restante 53 % se asume que es efecto directo. 

El procedimiento de las etapas de modelado fue la propuesta original para abordar el análisis de 
la mediación, pero actualmente se utilizan procedimientos alternativos más avanzados que toman la 
PRUEBA DEL EFECTO INDIRECTO como eje central del análisis. Esta prueba asume una distribución nor- 
mal para la inferencia, y divide el efecto indirecto (el producto de los coeficientes a x b) por una estima- 
ción de su error típico (S¿). Hay varias fórmulas al uso para derivar el error típico del efecto indirecto. La 
más recomendable es la que se obtiene por PROCEDIMIENTOS DE REMUESTREO (bootstrap), pero la más 
empleada es una fórmula propuesta por Sobel (1982, 1986), que es la que utilizaremos aquí. La prueba 
del efecto indirecto se define entonces mediante 


axb 
Z= (2.32) 
Sab 


donde la estimación del error típico con la fórmula de Sobel es: 


Sap= y 1255 + b?Sz (2.33) 


Para el ejemplo que tratamos, siendo a x b = 0.409 y Sap = v(0.369)2(0.437)? + (1.108)?(0.074)? = 0.181, 
la prueba del efecto indirecto es Z = 0.409/0.181 = 2.261, P = .012. Solamente cuando la prueba es sig- 
nificativa, como sucede en este caso, se demuestra la existencia de mediación. Y si se asume que el nivel 
de vocabulario (X) es una causa posible de autoestima (Z) y ésta a su vez una causa del nivel de com- 
prensión lectora (Y), el investigador puede concluir que el nivel de vocabulario explica la comprensión 
verbal por dos vías alternativas: por la vía directa (X — Y) y por la vía indirecta o mediada (X — Z — Y). 
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2.10.2. Modelos de moderación 


En un modelo de moderación, la tercera variable Z actúa moderando o condicionando la relación 
entre predictor y respuesta, de tal modo que la relación entre X e Y cambia en función del valor que 
toma Z. La figura 2.9 representa conceptualmente el efecto de moderación. Conviene precisar que, a 
diferencia del efecto de mediación de la figura 2.8, esta figura no representa el modelo de moderación, 
que se define a nivel estadístico como un efecto interactivo. Por ejemplo, el sexo (Z) puede moderar el 
efecto de la psicoterapia (X) sobre la depresión (Y), porque el efecto es diferente cuando la psicoterapia 
se aplica a varones que cuando se aplica a mujeres. 


a AS 


Figura 2.9. — Modelo de moderación. 


Los modelos que se utilizan para evaluar el papel que un moderador Z adopta moderando o condi- 
cionando la relación entre X e Y se denominan MODELOS DE MODERACIÓN. Dejando aparte la variable 
de respuesta, pueden darse varios casos, dependiendo del estatus métrico de X y Z: 


— XyZ son variables numéricas, en cuyo caso se considera un modelo de regresión. 
— X y Z son variables categóricas (o factores), en cuyo caso se considera un modelo ANOVA. 


— En los restantes casos (X categórica y Z numérica, o bien X numérica y Z categórica) pueden 
considerarse modelos ANCOVA. 


En cualquiera de los tres casos, el EFECTO DE MODERACIÓN se define estadísticamente como un 
EFECTO DE INTERACCIÓN entre el predictor y el moderador. El ANÁLISIS DE LA MODERACIÓN ESTADÍS- 
TICA (Baron y Kenny, 1986; Hayes, 2013) consiste en utilizar el procedimiento de regresión jerárquica 
para probar dos modelos alternativos, el primero de los cuales incorpora como predictores X y Z (mo- 
delo aditivo) y el segundo incluye además la interacción entre X y Z (modelo interactivo). La interacción 
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se define como una nueva variable resultante del producto de las dos variables implicadas. Una conse- 
cuencia directa de incluir una variable producto es el incremento del grado de colinealidad del modelo 
resultante. La ecuación del modelo interactivo es la siguiente: 


Y =Bo+B1X+B2Z2+P3Xx Z (2.34) 


pero a efectos de interpretación resulta más conveniente utilizar la ecuación siguiente, que es una sim- 
ple reordenación de los términos de la ecuación anterior: 


Y =(Bo+ B2DI+(B1+P$32)X (2.35) 


Cuando predictor y moderador son variables numéricas, como es el caso del ejemplo que trata- 
mos aquí, es una tradición, aunque también sometida a controversia (véase Kromrey y Fosters-Johnson, 
1998; Dalal y Zyckers, 2012), centrar los predictores, es decir, convertirlos en valores diferenciales me- 
diante la sustracción de los valores observados respecto de su media. Las razones que se argumentan en 
favor de esta práctica es que las variables centradas pueden reducir el grado de colinealidad y simplificar 
la interpretación de los coeficientes de regresión. 

En cualquier caso, se espera que predictor X y moderador Z sean estadísticamente significativos en 
la primera etapa (y por tanto el modelo 1 se ajuste aceptablemente), y que la interacción X x Z resulte 
significativa en la segunda etapa (y por tanto el modelo 2 se ajuste también aceptablemente). 

Para ilustrar el análisis de moderación, utilizamos de nuevo el Ejemplo 2.1 con las tres variables nu- 
méricas anteriormente empleadas en el análisis de mediación: la variable de respuesta comprensión 
(Y), el predictor vocabulario (X) y la variable moderadora autoestima (Z). El objetivo es determinar si la 
autoestima actúa moderando o condicionando la relación entre vocabulario y comprensión. Aplicamos 
el procedimiento de regresión jerárquica en dos etapas con predictor y moderador centrados. La salida 
2.31 es un resumen de los resultados, donde puede constatarse que el modelo 2 (interactivo) obtiene un 
incremento significativo del coeficiente de determinación, F(1,20) = 7.616, P = .012. La misma conclu- 
sión se obtiene en la salida 2.32 para el estimador del parámetro $3 = 0.115, ya que £(20) = 2.760; P = .012 
(recuérdese que con 1 grado de libertad para el numerador, F = 12). Además, el grado de colinealidad 
(FIV) de los estimadores de los parámetros no resulta problemático. Menos informativa es la salida 
2.33, pero se constata que ambos modelos son estadísticamente significativos. En consecuencia, puede 
afirmarse que la autoestima actúa moderando la relación entre vocabulario y comprensión. 


SALIDA 2.31 
Proceso de regresión jerárquica para el análisis de moderación 


Modelo 


1 (aditivo) 


2 (interactivo) 


Modelo 1: (Constante), cvoca, cauto 


Modelo 2: (Constante), cvoca, cauto, inter 
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SALIDA 2.32 
Estimadores de los parámetros de los modelos de regresión jerárquica 


Variable dependiente: comp 


Modelo | Parámetro 
1 (Constante) 

cuvoca 

cauto 


(Constante) 
cuoca 
cauto 

inter 


SALIDA 2.33 
Análisis de varianza de los modelos de regresión jerárquica 


Modelo | Fuentes SC tipo III 
1 Regresión 997.531 498.765 
Residual 520.428 24.782 
Total 1517.958 
Regresión 1141.060 380.353 
Residual 376.899 18.845 
Total 1517.958 


Modelo 1: (Constante), cvoca, cauto 


Modelo 2: (Constante), cvoca, cauto, inter 


Una vez probada la existencia de moderación, tiene interés utilizar la ecuación 2.35 con el objeto de 
visualizar las pendientes de regresión de la relación entre vocabulario y comprensión para puntos es- 
pecíficos del moderador. El efecto de moderación se visualiza bien con dos o más puntos. Supongamos 
que sustantivamente nos interesa especificar tres puntos, p. ej., valores altos, medios y bajos de autoes- 
tima. Usualmente el valor alto se especifica como el que se encuentra una desviación típica por encima 
de la media y el valor bajo el que se encuentra una desviación típica por debajo de la media. Para aplicar 
la ecuación 2.35 se precisan conocer con exactitud los valores de Z representativos de tales puntos. La 
escala de autoestima tiene una media de 0 (por tratarse de una variable centrada) y una desviación típica 
de Sz = v12.085 = 3.476 (véase salida 2.1). El punto medio de auto es 0, el punto alto es 0+ 187 = 3.476 
y el punto bajo es 0— 157 = -3.476. Utilizando los estimadores de los parámetros de la salida 2.30 y la 
ecuación 2.32, la ecuación predictiva del modelo 2 es Y = (12.606+1.003Z) + (0.436+0.115Z)X, y susti- 
tuyendo Z por el punto correspondiente obtenemos las tres ecuaciones de regresión que se representan 
en el GRÁFICO DE MODERACIÓN de la figura 2.10. 


Yara =  [12.606+ (1.003)(3.476)] + [.436+ (0.115)(3.476)]X = 16.092 + 0.836X 
Ymedia =  [12.606+ (1.003)(0)] + [.436+ (0.115)(0)]X = 12.606 +0.436X 
hara =  [12.606+ (1.003) (-3.476)] + [.436+ (0.115)(-3.476)] X =9.120+0.036X 


Estas ecuaciones ilustran el papel moderador de la autoestima en la relación entre vocabulario y 
comprensión. A modo de conclusión, comparando las diferentes pendientes de regresión de la figura 
2.10, se puede interpretar que la autoestima altera la naturaleza de la relación entre vocabulario y com- 
prensión ya que, con altos niveles de autoestima, la relación entre ambas variables es también alta, pero 
se reduce con niveles medios de autoestima y resulta prácticamente nula con niveles bajos. 
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Figura 2.10. — Gráfico de moderación 


Una nota final. Cuando para las mismas variables se ajusta un modelo de mediación y un modelo de 
moderación, el investigador está obligado a continuar el esfuerzo de modelado buscando modelos más 
apropiados para explicar esta ambigúedad. Los modelos de MEDIACIÓN MODERADA y de MODERACIÓN 
MEDIADA podrían entonces ser objeto de su interés (véase Hayes, 2013). 


2.11. SUGERENCIAS DE ESTUDIO 


Los modelos de regresión son los cimientos de los modelos con estructura LM. Es muy importante 
tener claros los conceptos básicos del modelo de regresión antes de proceder con el estudio de modelos 
de la misma estructura como ANOVA y ANCOVA, que tratamos en los capítulos siguientes. Referencias 
clásicas sobre modelos de regresión en particular y el modelo lineal general son Cohen et al. (2003), Fox 
(2008), Freund, Wilson y Sa (2006), Judd et al. (2008), Kutner ef al. (2005) y Pedhazur (1997). Hutcheson 
y Sofroniou (1999) lo tratan desde la perspectiva del modelado estadístico, que es el enfoque que segui- 
mos aquí. Entre las referencias actuales más relevantes sobre los modelos de regresión destacamos Fox 
y Weisberg (2011), Pardoe (2012), Seather (2009) y Weisberg (2014). 

Se dispone también de excelentes referencias sobre los modelos de regresión aplicados a la investi- 
gación en Psicología y disciplinas afines. Además de las referencias clásicas de Judd y Kenny (1981b) y 
Baron y Kenny (1986), que es el artículo metodológico más citado de la literatura psicológica, destacan 
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los trabajos de MacKinnon (2007, 2008 y 2011), Hayes (2013) y Jose (2013) para mediación y Aiken y West 
(1991, 1993) y Aguinis (2004) para moderación. 

Además, resulta también recomendable consultar las páginas web dedicadas a ambas temáticas por 
el profesor David Kenny, que él mismo actualiza periódicamente: 


— http://davidakenny.net/cm/mediate.htm 
— http://davidakenny.net/cm/moderation.htm 


Una última referencia a considerar son los excelentes documentos para la enseñanza de la Estadística 
del profesor Karl Wuensch (Department of Psychology, East Carolina University), que están en continua 
actualización y se encuentra en http://core.ecu.edu/psyc/wuenschk/StatsLessons.htm. 
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3.1. INTRODUCCIÓN 


Los MODELOS DE ANÁLISIS DE VARIANZA (MODELOS ANOVA) son un caso particular de la estructura 
LM cuyo exponente más general es el modelo de regresión. El modelo ANOVA difiere del modelo de 
regresión por utilizar como variables explicativas solamente variables categóricas, que tienen que ser 
adecuadamente codificadas para ser tratadas por los algoritmos de cálculo numérico. 

Los modelos ANOVA son de hecho una simplificación de los modelos de regresión. En la práctica, 
todos los modelos ANOVA pueden también ajustarse mediante modelos de regresión. Sin embargo, pa- 
ra muchas de las situaciones especiales que plantea la investigación experimental y no experimental en 
psicología, los modelos ANOVA incorporan algunas propiedades específicas que los hacen más apropia- 
dos que los modelos de regresión. Los modelos ANOVA son también una generalización a más de dos 
grupos de la prueba t de Student para dos grupos, sin embargo, en este texto consideramos la prueba £ 
como un caso particular del modelo ANOVA para dos grupos. 

Respecto a los modelos de regresión, los modelos ANOVA introducen nuevos conceptos con los que 
es preciso familiarizarse. Algunos de los más relevantes son los siguientes: 


— En primer lugar, el concepto de FACTOR. En general, un factor es una variable categórica medida 
en escala nominal u ordinal cuyas categorías se denominan niveles, condiciones o tratamientos. 
Se distinguen dos tipos generales de factor: 


+ UN FACTOR DE TRATAMIENTO es una variable categórica cuyos niveles son específicamente 
los tratamientos a los que se asignan los participantes (en este contexto denominados tam- 
bién UNIDADES EXPERIMENTALES) de forma controlada por el investigador. El ejemplo más 
simple es la definición por parte del investigador de dos grupos (el factor grupo), uno al que 
se asignan las unidades que reciben tratamiento (grupo experimental, GE) y otro al que se 
asignan las unidades que no reciben tratamiento (grupo control, GC). 


+ UN FACTOR DE CLASIFICACIÓN es una variable categórica cuyos niveles son clases homogé- 
neas de unidades experimentales, y su administración no está controlada por el investigador. 
Por ejemplo, el factor sexo es un factor de clasificación con dos clases homogéneas (varones 
y mujeres). 
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En cualquier caso, la estimación de los parámetros carece por lo general de interés en un modelo 
ANOVA para centrarse en la descomposición de la varianza, prescindiendo por tanto de una de 
las dos salidas típicas de los modelos de regresión. La razón de ello es que los estimadores depen- 
den del tipo de codificación empleado para transformar el factor en vectores numéricos. El tipo 
de codificación más usual es la codificación tipo ANOVA (codificación de efectos) para factores 
nominales y la codificación polinómica ortogonal para factores ordinales. Sin embargo, la estima- 
ción de parámetros puede resultar importante para interpretar apropiadamente los resultados del 
análisis. 


— En segundo lugar, el concepto de RÉPLICA. Un experimento puede realizarse si un investigador 
tiene al menos tantos sujetos participantes (o unidades experimentales) como tratamientos. Sin 
embargo, no puede estimarse la VARIANZA DE ERROR a menos que los tratamientos sean replica- 
dos, es decir, para cada nivel del factor de tratamiento o clasificación tiene que haber como míni- 
mo dos unidades experimentales. En general, se denomina réplica de un tratamiento a cada una 
de las observaciones independientes del tratamiento, cada una de las cuales requiere una unidad 
experimental diferente. Es muy importante tener en cuenta esta definición, porque es muy co- 
mún confundir este concepto. Por ejemplo, dos medidas independientes del peso de una misma 
unidad no proporcionan una medida de la variación en los pesos de la población de unidades. 
Son medidas repetidas de la misma unidad pero no constituyen réplicas independientes del peso 
de la población. Se llaman también PSEUDO-RÉPLICAS. 


— Y finalmente, el concepto esencial de EFECTO DE TRATAMIENTO, que es la diferencia entre las me- 
dias de la variable de respuesta en función del nivel del factor. Hay dos tipos de efectos de tra- 
tamiento (efectos fijos y efectos aleatorios) que pueden ser utilizados en el contexto del ANOVA 
de un factor y que generan tres tipos de modelos diferentes, a saber, el MODELO DE EFECTOS FI- 
JOS (0 MODELO I), el MODELO DE EFECTOS ALEATORIOS (O MODELO Il) y el MODELO DE EFECTOS 
MIXTOS (O MODELO IID). Para comprender la diferencia entre los modelos, es preciso asumir una 
POBLACIÓN DE TRATAMIENTOS, que se define hipotéticamente como el conjunto de todos los .4 
posibles tratamientos que pueden definirse para un determinado factor A, y de la cual el investi- 
gador selecciona un número a de tratamientos. Suponiendo que existe una población de medidas 
de la variable de respuesta para cada tratamiento sobre el que se desean realizar inferencias, y que 
tales medidas se distribuyen normalmente, pueden ocurrir uno de los dos casos siguientes: 


+ El investigador se interesa exclusivamente por un restringido número de niveles de trata- 
miento de la población de forma arbitraria, despreciando todos los demás por carecer de 
interés para su investigación. En tal caso se fijan los tratamientos de la población en un res- 
tringido número de niveles, observando un total de a tratamientos. Entonces a = 4 y el 
investigador solamente podrá generalizar los resultados obtenidos a la población de trata- 
mientos restringida, pero no a todos los tratamientos posibles. Este es el MODELO DE EFEC- 
TOS FIJOS. Una consecuencia importante de esta forma de definición de los tratamientos es 
que una repetición del experimento necesariamente implica el uso de los mismos niveles 
de tratamiento utilizados en el experimento original y las inferencias quedan limitadas a los 
tratamientos prefijados de forma arbitraria por el investigador. Otra consecuencia es que los 
procedimientos de COMPARACIÓN ENTRE MEDIAS DE GRUPO que se realizan cuando la prueba 
F global (omnibus) para el factor es estadísticamente significativa, solamente están justifi- 
cados cuando el factor asume efectos fijos (modelo D. 
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+ El investigador se interesa por todos los niveles de la población de tratamientos, pero selec- 
ciona al azar un número limitado de a tratamientos de la población. En tal caso, los trata- 
mientos de la población no presentan ninguna restricción. Entonces a < 4 y el investiga- 
dor podrá generalizar los resultados obtenidos con una muestra de a tratamientos a las .4 
poblaciones de tratamiento. Este es el MODELO DE EFECTOS ALEATORIOS. La principal conse- 
cuencia de esta forma de definición de los efectos de tratamiento es que una repetición del 
experimento no necesariamente implica el uso de los mismos niveles de tratamiento (excep- 
to si sucede por azar) y las inferencias pueden extenderse a todos los tratamientos posibles 
de la población. Otra consecuencia de interés es que los procedimientos de comparación 
entre medias de grupo no son apropiados para el modelo II. 


+ Con dos o más factores, cuando todos los efectos definidos por el investigador son fijos se 
aplica el modelo 1, cuando todos son aleatorios se aplica el modelo de efectos aleatorios 
(modelo II) y cuando se presenta una mezcla de efectos fijos y aleatorios se aplica el modelo 
III. Los modelos de efectos mixtos mantienen las propiedades de los efectos definidos para 
cada uno de los factores. 


3.2. MODELOS ANOVA DE UN FACTOR 


Suponiendo un factor, que llamaremos A, con a niveles de tratamiento, cuyos efectos se han defini- 
do de acuerdo con el modelo 1, y un total de n réplicas, el modelo apropiado para analizar las N = an 
observaciones es el ANOVA DE UN FACTOR CON EFECTOS FIJOS, que se formula de forma general me- 
diante una de dos parametrizaciones alternativas equivalentes: 


Yi = Hj+€ij (3.1) 
Yi; = p+aj+ejj (3.2) 


La primera corresponde al modelo de medias y la segunda al modelo de efectos, cada una de las cuales 
tiene sus ventajas e inconvenientes (véase Hocking, 2013; Kutner ef al., 2005). En este texto seguiremos 
en lo fundamental la segunda parametrización por ser más familiar y computacionalmente más conve- 
niente que la primera. En el modelo de efectos: 


— Y; es el valor observado de la variable de respuesta para la ¿-ésima réplica en el ¡-ésimo trata- 
miento (para ¡=1,2,..., a); 


— ¡pes la respuesta esperada global, que es constante para todos los tratamientos y todas las réplicas; 
— Hj= +4 son los valores medios de la respuesta esperada para el tratamiento j; 


— Qj= Hj¡— y es el efecto del ¡-ésimo tratamiento, que es constante para todas las réplicas dentro 
de un tratamiento, pero que puede diferir para diferentes tratamientos; 


— €¡¡ = Y¡¡— HMj €s el residuo o error experimental que corresponde a la réplica ¡ del tratamien- 
to ¡. Se asume que los residuales del modelo ajustado son NID (Normal e Independientemente 
Distribuidos) con varianza constante, o sea, e;; — NID(O, 0), siendo os la varianza del error o 
VARIANZA RESIDUAL. 
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El modelo de efectos fijos (modelo D) asume que los efectos a; correspondientes al factor A son 
efectos fijos, es decir, sus niveles han sido prefijados por el investigador, y por tanto la generalización de 
los resultados no podrá extenderse más allá de los tratamientos utilizados. En consecuencia, 


E(Yij) = El(u+0Qj¡+€;j)=u4+a0j (3.3) 
VIV) = V(u+aj¡+e¡;)=V(e;;)=0% (3.4) 


donde yu y 4; son constantes, la primera para todos los tratamientos y la segunda para las réplicas del 
tratamiento ¡. La ecuación 3.2 establece que el valor observado para la réplica i del tratamiento ¡ puede 
ser explicado sobre la base de tres componentes aditivos: una media global (1), un efecto de tratamiento 
específico del factor bajo consideración, a; = 41¡— pu, que ha sido prefijado por el investigador, y un efecto 
residual e;; compuesto de efectos de variables desconocidas. Los estimadores de los parámetros y y 4; 
se asumen insesgados y son, respectivamente, 


po Y (3.5) 
dj = Aj-A=Y¡-Y (3.6) 


3.2.1. La descomposición de la variación 


Sustituyendo en el modelo de la ecuación 3.2 los parámetros por sus estimadores obtenemos 
y =Y+Y7= 1062 Y7) 


que es una simple identidad si se eliminan los paréntesis. Trasladando a la izquierda el primer término 
de la derecha utilizamos una escala común con puntuaciones diferenciales 


Mj= 1 =1= 10 =Y p 


y elevando al cuadrado y sumando para todo i y ¡ obtenemos la ecuación básica del modelo ANOVA de 
un factor, que es una simple generalización del teorema de Pitágoras, 


AV = Y VA Y 
ji ] J 1 


6.7 
SCrT = SCm + SCr 


La ecuación 3.7 representa la descomposición de la SC TOTAL (SCT) en los dos componentes básicos de 
todo modelo lineal, la SC EXPLICADA POR EL MODELO (SCpy) y la SC NO EXPLICADA POR EL MODELO, SC 
ERROR O SC RESIDUAL (SC). En el modelo ANOVA con un factor la SC), es única, pero en los modelos 
con más de un factor la SCy se subdivide a su vez en componentes, cada uno de los cuales representa 
un efecto particular. 
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Esta descomposición de la SCr es paralela a la descomposición de los grados de libertad. Para el 
componente SCr los grados de libertad son g!7 = N—1. La SC;y tiene un total de g/yy = a— 1 grados de 
libertad, ya que implica un total de a tratamientos, y a la SCp le corresponden la diferencia, gl = N—a, 
ya que se refiere a la variación de las unidades experimentales respecto del tratamiento al que fueron 
asignadas: 


N-1= a-1 + N-a 


(3.8) 
g8lr= glu + g8lr 


Además de los tres componentes básicos presentes en toda descomposición de la variación (SCr, 
SCu y SC), en los modelos ANOVA hay que contemplar también la variación de las medias de los 
tratamientos respecto de la media global. En el caso de un solo factor (que en adelante lo identificaremos 
como 4), la SCA es la suma de las diferencias cuadráticas entre las medias de tratamiento y la media 
global y es igual a SCyy porque no existe más que un factor. Hay dos formas de cálculo equivalentes, la 
primera referida a diferencias de medias y la segunda a sumas de tratamiento: 


a a A T? 
SCa=SCm=)»ni(Y¡-1=Y --— (3.9) 
7 ps 


En los modelos ANOVA se produce una simplificación en el cálculo de la SCA que no es posible en los 
modelos de regresión y que permite obtenerla directamente sumando el producto de las varianzas de 
cada grupo (8%) por sus respectivos grados de libertad (n—1). Con esta formulación es posible desarrollar 
los resultados del ANOVA utilizando una tabla de casos, promedios, sumas y varianzas para cada uno de 
los niveles del factor: 


a A 
SCr=) nj(Yi¡- Y *= Y [Sin D)] (3.10) 
J j 


El cuadro 3.1 resume las cantidades básicas y las fórmulas de cálculo para cada uno de los elementos 
de esta descomposición. Las cantidades básicas conciernen en primer lugar a la corrección de la media, 
(con símbolo [1]), cuyo cálculo requiere un término único referido a la suma total de las observaciones 
de la variable de respuesta (2 Y = T), en segundo lugar a los marginales de A (con símbolo [4]), referido 
a la suma de las observaciones para cada nivel de A, y por tanto con tantos términos como niveles de 
A existan, y finalmente a los residuales (con símbolo [R]), que se obtienen aplicando la ecuación 3.10 y 
que requieren tantos términos como el producto del número de varianzas por el número de réplicas (n) 
menos uno. Las sumas de cuadrados y los grados de libertad objeto de la descomposición de la varianza 
se obtienen a partir de las cantidades básicas. A destacar que SCyr = SCa y 8 lu = 8 la. 

Las correspondientes medias cuadráticas resultan de dividir las sumas de cuadrados por sus respec- 
tivos grados de libertad. Así se definen MC = SCa/ gla (que es igual a MCy = SCu/glm porque sólo 
hay un factor) y MC = SCr/ glp. En ocasiones también tiene interés definir MCr = SCT /glr, aunque 
MCT es simplemente una estimación de la varianza de la variable de respuesta. 
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CUADRO 3.1 
Cantidades básicas y fórmulas de cálculo para el modelo ANOVA de un factor 


Cantidades básicas Fórmulas de cálculo  N“términos 

[1]: Corrección media T?2/N 1 
[4] : Marginales A dE j (a In) a 
[R]: Residuales (n; - Dx; si (n- Da 

Sumas de cuadrados Fórmulas de cálculo G. libertad 
SCA =NY ¡5 [A] - [1] gla=a-1 
SCp=YE ¡E ¡(Yi¡ -Yp? [R] glr=N=a 
SC =nY ¡(Y ¡- Y)” [A] - 1] glm=a-1 
SCr= EE? | 141+1R)- 01] gly=N-1 


Es importante advertir que MCa y MC son estimaciones independientes de la varianza de error de la 
población. Sin embargo, mientras la segunda es una estimación pura de la varianza de error, la primera 
contiene además la variación de los efectos de tratamiento a ;, de tal forma que las esperanzas matemá- 
ticas de ambas medias cuadráticas, suponiendo el mismo número de réplicas (n) por tratamiento, son 
respectivamente: 


nx ja 


E(MCa) =0%+n0% (3.11) 


!l 
Q 


+ 
a—-1 


E(MCp) 


!l 
Q 
an 


(3.12) 


donde e, = (Y 5) /(a—1) esla (cuasi)varianza de las medias de las poblaciones de tratamiento definidas 


en el factor A (pero no es una varianza auténtica porque divide por a—1 y no por a) que puede estimarse 
mediante 


Ba TA (3.13) 


aunque conviene tener en cuenta que la estimación puede producir resultados negativos, en cuyo caso 
por convención se hace igual a cero. 

La inferencia clásica con el modelo de efectos fijos formula como hipótesis nula Hp : 1 =... = 
Hj=...= Ha, O también Hy : 4; =0, para todo ¡. Para probar la hipótesis nula se emplea el estadísti- 
co F= MCA/MCz, que sigue una distribución F, con a—1 y N-— a grados de libertad para numerador y 
denominador respectivamente. Obsérvese que: 


— Si se cumple la hipótesis nula, a; =0 y la razón entre las esperanzas de ambas medias cuadráticas 
será E(MCA)/E(MCp) =0?/0?=1. 


— Si no se cumple la hipótesis nula, a; 4 0 y la razón entre las esperanzas de ambas medias cuadrá- 
ticas será E[MCA)/E(MCp) =1+ (n62 107), una razón que depende de la magnitud de a. 


En consecuencia, la (cuasi)varianza de las medias de tratamiento ga concentra todo el interés de la 
prueba de hipótesis nula. Téngase en cuenta que si todos los efectos a ¡ son igual a cero, 0% será también 
igual a cero. Pero si alguno de los efectos es diferente de cero, 8, será también diferente de cero. 


OEdiciones Pirámide 


Modelos ANOVA con efectos fijos 109 


En el cuadro 3.2 se resumen los resultados esenciales del análisis de varianza para un factor A, con 
la clásica partición de la SCT en SCy y SC, y la incorporación de un componente propio (SCa), que 
coincide exactamente con la SCyy y centra toda la atención del análisis. 


CUADRO 3.2 
Tabla ANOVA de un factor (modelo 1) 


Fuentes | SC tipo III MC F 
Modelo SCm MCu=SCm/glm | Fm= MCum!/MCr 
A SCA MCA=SCa/gla F¿= MCA/MCr 


Residual SCr MCr =SCr/glr 
Total SCT MCT =SCr!/glr 


3.2.2. Ajuste global, ajuste condicional y magnitud del efecto 


Para valorar el ajuste global relativo de un modelo ANOVA se utilizan los criterios ya conocidos, a 
saber, la significación de la razón F para el modelo o la proporción de varianza explicada. En general, un 
modelo ANOVA de un factor se considera bien ajustado cuando el modelo conjunto es estadísticamente 
significativo o la proporción de varianza explicada difiere significativamente de cero. En los dos casos se 
utiliza una prueba F equivalente para valorar empíricamente el ajuste. 

La razón F de un modelo ANOVA de un factor nos informa acerca de si la varianza explicada difiere 
significativamente de la varianza no explicada por tal modelo, o sea de su SIGNIFICACIÓN ESTADÍSTICA. 
Su magnitud no sólo depende del efecto que tenga el factor, sino también del tamaño muestral. En con- 
secuencia, una F estadísticamente significativa no necesariamente se asocia con un efecto relevante del 
factor. Para valorar la SIGNIFICACIÓN PRÁCTICA del resultado de un modelo ANOVA es conveniente uti- 
lizar MEDIDAS DE MAGNITUD DEL EFECTO que nos permiten detectar efectos de tratamiento relevantes 
(véase Cohen 1988; Cortina y Nouri, 2000; Ellis, 2010; Grissom y Kim, 2005; Kirk, 2013). Se han distin- 
guido dos tipos básicos de medidas de magnitud del efecto (Rosnow y Rosenthal, 2003): los indicadores 
tipo d, que se basan en la diferencia de medias estandarizada, y los indicadores tipo r, que se basan en 
la correlación y la proporción de varianza explicada y son los que se utilizan comúnmente en el con- 
texto de los modelos ANOVA y el diseño de investigación. El indicador más simple es el coeficiente de 
correlación r, para cuya interpretación Cohen (1988) propuso las etiquetas bajo (0.10), medio (0.30) y 
alto (0.50). De mayor interés en el contexto del diseño de investigación son los indicadores basados en 
R?, para cuya interpretación se emplean las etiquetas bajo (0.01), medio/moderado (0.09) y alto (0.25). 

Con modelos ANOVA una medida de magnitud del efecto es ETA CUADRADO (77), que es equivalente 
al coeficiente de determinación de un modelo de regresión (recuérdese que el coeficiente de correlación 
p es la correlación entre una variable de respuesta numérica y un predictor numérico, mientras que n es 
la correlación entre una variable de respuesta numérica y un factor categórico). Para el factor A es: 


SC hxE 
y A EMBA (3.14) 
SCr (gh xFAJ+gl 


donde gl (0 £laum) y £l2 (0 8lgen) son los grados de libertad de la prueba Fa. La primera de las dos 
fórmulas se utiliza cuando se tiene acceso a las sumas de cuadrados; la segunda cuando sólo se tiene 
acceso al valor empírico de F, como sucede en casi todas las investigaciones publicadas y por ello son 
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muy útiles en metaanálisis. Sin embargo, se ha demostrado que 1? es un estimador sesgado de la propor- 
ción de varianza explicada (Hays, 1988). Entre otras limitaciones, está sesgado por el tamaño muestral. 
El indicador 7? se considera por tal razón un indicador dependiente de la muestra (caso muestral). 

Un estimador menos sesgado por el tamaño muestral, aunque de uso no muy extendido en psicolo- 
gía, es OMEGA CUADRADO (2), que fue propuesto por Hays (1988). Para el factor A del modelo ANOVA, 
se estima, dependiendo de que se conozcan las SC o sólo se tenga acceso a la razón F, con: 


07 = SCA (a=1MCr _ _ (glN(Fa-D (8.15) 
SCT + MCr (gID(Fa-D+N 


pero conviene tener en cuenta que con la primera formulación pueden producirse estimaciones de w? 
negativas. En tales casos, los valores de ú? < O deben fijarse por convención en cero. 

La ecuación 3.15 es válida para el caso ANOVA de un factor. Para casos más complejos es más re- 
comendable utilizar una formulación más general basada en la estimación de los componentes de la 
varianza. Hay varias formas de estimar los componentes de la varianza, pero empleamos aquí el de- 
nominado método de los momentos, que consiste en igualar los momentos de la muestra respecto del 
origen con los momentos de la población. Con este método la varianza total de la variable de respuesta, 


que designamos como a es equivalente a (pero no necesariamente igual a) 05 


2 a-1 
or=|-— 
T dá 


0, +0.=6%+0% (3.16) 


donde S = [(a-1)/ aló% es el componente de varianza de las medias para un factor fijo y a? el compo- 
nente de varianza de error. La estimación del primer componente puede hacerse mediante 


2 = (a—- 1) (MC, —- MCp) 
sa N 


(3.17) 


y WA es entonces la razón entre el estimador de la varianza de las medias (94) y la varianza total (0d: 


ó7 ds 

02 A A 
===> (3.18) 

+07 67 


El cuadro 3.3 resume las principales medidas de magnitud del efecto con modelos ANOVA de un 
factor, utilizando un indicador tipo d (en concreto, la medida f propuesta por Cohen, pero raramente 
usada) y los dos indicadores tipo r tratados, tanto para estimación muestral (f, y 7?) como poblacional 
(f y v?), y la relación entre ambos tipos de medidas de magnitud del efecto, junto con la interpretación 
estándar recomendada por Cohen (1988). Con modelos ANOVA no paramétricos se emplea una medi- 
da directa de comparación de medias, r = z/ VN, también propuesta por Cohen (1988), donde z es la 
aproximación a una distribución normal para grandes muestras de los estadísticos U de Mann-Whitney 
y KW de Kruskal-Wallis (véase Corder y Foreman, 2009), ambos con las etiquetas en valores absolutos 
de 0.1 (bajo), 0.3 (medio) y 0.5 (alto) para su interpretación. Otra medida no paramétrica para dos o más 
grupos usada en ocasiones es la DELTA DE CLIFF (véase Macbeth, Razumiejezyk y Ledesma, 2011). 
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CUADRO 3.3 
Medidas de magnitud del efecto para ANOVA de un factor 


Tipo de medida Caso Fórmulas 


A SC felix F 
Medidas tipo d Muestral f= = z _,/81*XFA 
Nó% N 


Bajo (.2), Medio (.5), Alto (.8) Poblacional 


Medidas tipo r Muestral ñ 8H x Fa (Ec. 3.14) 


"TEN, xF0+gh 


gx (Fa-1D) 


Bajo (12, Medio (32), Alto (52) Poblacional = gh x(PA-D+ 


N (Ecs. 3.15/3-18) 


22 
a 


Relación entre Muestral Waz Nf+ gb 
1 +8% 


medidas tipo d y tipo r Poblacional 


Respecto al ajuste condicional, en un modelo ANOVA de un factor solamente pueden definirse dos 
modelos anidados, a saber, el modelo nulo (Y; j¡=H+€jj), que es el modelo restringido, y el modelo 
ANOVA (Y;¡ = 1+ 4 + e;;), que es el modelo aumentado. Puesto que difieren en el componente a;, 
el ajuste condicional entre ambos modelos es equivalente a la prueba de hipótesis nula Hp : a¡=0 
mediante la razón F. 


3.2.3. Potencia y tamaño muestral 


Es importante que una prueba estadística tenga una alta probabilidad de rechazar la hipótesis nula 
de que no hay efecto de tratamiento cuando la hipótesis nula sea falsa, es decir, cuando el efecto de 
tratamiento sea relevante. La POTENCIA de una prueba estadística es una medida de su sensibilidad para 
detectar, si existen, efectos de tratamiento, y se define como 1-6 =P(F> Fs, gl, 2121 Ho falsa), donde gl: y 
gl, son los grados de libertad de numerador y denominador de la razón F. El ANÁLISIS DE LA POTENCIA es 
útil para conjugar la sensibilidad de un diseño de investigación, la magnitud del efecto de tratamiento 
apropiado y el tamaño muestral óptimo a utilizar en una investigación. Se considera que un valor de 
potencia de 1 — 6 > 0.80 es óptimo en la mayoría de las ocasiones. 

Hay varias situaciones en las que el análisis de la potencia puede tener interés para el investigador 
aplicado (Myers, Well y Lorch, 2010). La primera situación se produce cuando el investigador pronostica 
un efecto de tratamiento pero el resultado no es estadísticamente significativo. Puede suceder que no 
exista en realidad efecto o bien que exista un efecto pero el diseño de la investigación tenga poca po- 
tencia para detectarlo. La segunda situación se presenta cuando el investigador pronostica que no hay 
efecto de tratamiento y efectivamente se encuentra que el efecto no es significativo. En este caso, el in- 
vestigador estaría interesado en demostrar que la potencia de la prueba fue muy alta, y por tanto si no se 
obtuvo un efecto de tratamiento fue porque el efecto era irrelevante. La tercera situación ocurre cuando 


OEdiciones Pirámide 


112 Diseños de investigación en Psicología 


el investigador pronostica que no hay efecto de tratamiento pero se encuentra que el efecto es significa- 
tivo. En este caso, al investigador le gustaría demostrar que el efecto no era de magnitud suficiente para 
tener importancia teórica o práctica. 

Supongamos que tenemos un factor con a tratamientos y n réplicas y que se aplica ANOVA de un 
factor. La potencia de una prueba depende de los siguientes elementos (Cohen, 1992; Myers et al., 2010): 


— El nivel de significación fijado por el investigador, que por lo general suele ser 0.01 o bien 0.05. 
Cuanto más se reduzca el nivel de significación, tanto menor será la probabilidad de rechazar la 
hipótesis nula y más baja será la potencia. 


— Los grados de libertad de numerador gl; = (a—1) y denominador gl, = a(n—-1) = N— a de la prueba 
F. El numerador está determinado por a, mientras que el denominador está determinado por a 
y por n. El valor de a está justificado por la naturaleza del estudio, pero el valor de n suele ser 
arbitrariamente decidido por el investigador y se justifica por razones de economía y tiempo. El 
análisis de la potencia permite determinar el tamaño muestral óptimo. 


— La varianza residual o de error da, que se considera una medida de ruido. Cuanto menor sea el 
ruido que muestran los datos más facil será detectar efectos de tratamiento. La potencia se incre- 
menta a medida que disminuye la varianza de error. 


— La magnitud del efecto de tratamiento, que es básicamente una función de la diferencia entre las 
medias de tratamiento 4 ;. En el caso de la prueba Fa, la potencia para rechazar la hipótesis nula 
de diferencia de medias de tratamiento será mayor cuanto mayor sea el tamaño del efecto Wa o la 
(cuasi)varianza 0. 


Muchos de los elementos citados (en particular 0? y w%) son parámetros desconocidos. Si se cono- 
cieran podría definirse un ÍNDICE DE POTENCIA dp: 


nY alla? - 
E Dg) (3.19) 
a a a 


donde 1 = nY a2/0? se denomina PARÁMETRO DE NO CENTRALIDAD y evalúa la distancia entre dos dis- 
Jroe y 


tribuciones que se comparan, a saber, la distribución F central, con grados de libertad g/¡ = (a— 1) para 
el numerador, gl? = N— a para el denominador y parámetro de no centralidad A =0, y la distribución 
F no central, con los mismos grados de libertad para numerador y denominador y parámetro de no 
centralidad 4 4 0. Cuando mayor es el parámetro de no centralidad más se achata la distribución F, 
haciéndose más alargada y alejada de la posición central. Nótese que, manteniendo constantes » 0% y 


0?, el parámetro de no centralidad depende directamente del tamaño muestral n. Con valores fijos del 
nivel de significación, y de los grados de libertad de numerador y denominador de F, la potencia será 
tanto mayor cuando mayor sea el parámetro de no centralidad (véase Maxwell, Kelley y Rausch, 2008). 
El ANÁLISIS PROSPECTIVO DE LA POTENCIA suele aplicarse durante la fase del diseño de una investi- 
gación y se determina consultando la distribución F no central para estimar el tamaño muestral óptimo 
con el nivel de significación a, el índice de potencia ( y los grados de libertad de numerador y deno- 
minador. Aunque se trata de una práctica controvertida (véanse los trabajos de Lenth, 2007 y de Levine 
y Ensom, 2001 para comprender esta polémica), el ANÁLISIS RETROSPECTIVO DE LA POTENCIA se aplica 
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una vez concluida la investigación para evaluar la potencia observada con el nivel de significación, los 
grados de libertad de numerador y denominador de la razón F y el parámetro de no centralidad 1. Una 
estimación muy simple de A (y por ende, del indice de potencia ¿) utiliza el producto de la razón F por 
los grados de libertad del numerador de la razón, 


A= (ENE) (3.20) 


3.2.4. Ejemplo 3.1 


Utilizamos como ilustración del modelo ANOVA de un factor los datos del ejemplo 3.1, donde se 
pretende saber si la información acerca del nivel de dificultad (dif) proporcionada antes de solucionar 
un problema complejo tiene alguna repercusión sobre el rendimiento (rend). El investigador fijó tres 
niveles de información sobre la dificultad ('baja”, 'media' y *alta'), y distribuyó al azar N = 24 unidades 
experimentales entre los tratamientos (o sea, n= 8 réplicas por nivel). El rendimiento se midió en una 
escala de 1 a 9 puntos, obteniendo los resultados que se muestran en el cuadro 3.4. 


CUADRO 3.4 
Datos empíricos del ejemplo 3.1 


La hipótesis nula que se plantea es que el rendimiento es igual en los tres grupos: Hp : 1 = Ma = 
Hz, O también que los efectos de tratamiento son nulos, Ho : 4; = 0, para todo j, donde a; = uj¡— p. 
Asumimos que la selección de estos tres niveles ha sido predeterminada por el investigador, a quien 
interesa estudiar el comportamiento de los tres niveles, despreciando otros niveles posibles. 

Antes de abordar el análisis con calculadora de escritorio, es necesario disponer de una tabla con 
los estadísticos descriptivos básicos de la variable de respuesta para cada uno de los niveles del factor, 
en concreto, la media, la suma (bruta), la varianza y el tamaño muestral (n) para comprender mejor la 
descomposición de la variación. El cuadro 3.5 responde a esa demanda. 


CUADRO 3.5 
Análisis descriptivo derend para cada nivel de dif 


Variable dependiente: rend 
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La figura 3.1 muestra un gráfico de los promedios de dif, cada uno de los cuales se representa con 
barras de error para un intervalo de confianza del 95%, permitiendo una evaluación visual de la varia- 
bilidad de cada uno de los tratamientos. 


1 1 
Baja Media Alta 
dif 


Figura 3.1. — Gráfico de medias de difcon barras de error al nivel de confianza del 95%. 


La descomposición de la variación utiliza las fórmulas de cálculo desarrolladas en el cuadro 3.1. Para 
los datos del ejemplo 3.1, todo el proceso de cálculo se resume en el cuadro 3.6. 


CUADRO 3.6 
Descomposición de la variación y fórmulas de cálculo para el ejemplo 3.1 
Cantidades básicas Procedimiento de cálculo No términos 
11 =72/N (127)? /24= 672.042 | 1 
[A] = E 42/n (522 /8) + (402/8) + (352/8) = 691.125 | 3 
[R] = (nj -DY si (7)(.8571 + 1.1429+ 2.8393) = 33.875 | 21 
Sumas de cuadrados Procedimiento de cálculo G. libertad 
SCA=nYE 4*(=SCm) [4] —[1]=19.083 | gl4=2 
SCp=YE H(Y¡¡-Y¡? [R] =33.875 | glp=21 
SCm =n (Y ¡- Y? [A] -[1]=19.083 | gly =2 
SCr =YE YX (Y;¡- Y? [4] +[R]-[1]=52.958 | gly =23 


Finalmente, el análisis de varianza se resume en la salida 3.1. El valor empírico de la prueba, F(2,21) = 
5.915; P = .009, apunta que el factor A es estadísticamente significativo. 
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SALIDA 3.1 
Análisis de varianza del modelo 


Variable dependiente: rend 
Fuentes | SC tipolII 
Modelo 19.083 


A (dif) 19.083 
Residual 33.875 
Total 52.958 


La salida 3.2 muestra el ajuste condicional entre los dos únicos modelos que son posibles con ANOVA 
de un factor, el modelo nulo (Y¡¡ = 1+ ej) y el modelo aumentado (Y; = 1+0;¡+€ej5). La diferencia 
entre los dos es precisamente el efecto de tratamiento «;, y su estimador representa una diferencia 
en sumas de cuadrados de ASC = 19.083 y en grados de libertad de Aglz = 2. La razón resultante, 
F = (19.083/2)/(33.875/21) = 5.915, con P = .009, es equivalente a la F de la salida 3.1 y apunta que hay 
diferencias significativas entre los dos modelos. En consecuencia, el modelo 2 es el modelo de elección. 


SALIDA 3.2 
Ajuste condicional de dos modelos para el ANOVA de un factor 
Modelo 1: rend= 1 
Modelo 2: rend=1 + dif 
Modelo 
1: [1] 


2: [A] 


Un análisis complementario de los efectos de tratamiento del modelo ANOVA de un factor puede 
obtenerse utilizando medidas de magnitud del efecto. Utilizando la ecuación 3.14 puede estimarse a 


SCu 19.083 
= = 0.360 
SCm+SCr  19.083+33.875 “"—— 


Na= 


mostrando que el 36% de la varianza de la variable de respuesta está explicada por los efectos de trata- 
miento (factor A, dif). De forma similar a como se practica en un análisis de regresión, puede también 
definirse una partición de la variación total entre Ma (proporción de varianza explicada por el factor) y 
su complementario 1 — Ya (proporción de varianza no explicada por el factor). La razón entre ambos 
componentes es equivalente a la prueba F del ANOVA de la salida 3.1: 


2 
lgl 
(1-n)/glk  0.640/21. === 


Pero no conviene olvidar que má es una medida sesgada. Es más recomendable utilizar w?, que pre- 
senta menor grado de sesgo y puede obtenerse mediante alguna de las dos formas de la ecuación 3.15, 


-(a-1)M 19.083 — (2) (1.613 ix (Fa-1 2)(4.915 
SCA—(a—1)MCg _ ASI 0791 07 EAN FA AS) o 9 


ADO 
iS SCr + MCr 52.958 + 1.613 ES gh x(Fa-D+N  (Q)U.915)+24 


En general, w? produce siempre una medida de magnitud del efecto más reducida y más precisa que 7?. 
Una fórmula de cálculo recomendada para modelos ANOVA más complejos requiere la estimación de 
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los componentes de la varianza S (ecuación 3.17) y a? del modelo ANOVA de un factor, donde 


_ [a D(MCA—MCR) _ (2)(9.542 1.613) _, ¿2 


Í 
A N 24 == 


y siendo 6% = MCp = 1.613, la estimación de la varianza total es la suma de los dos componentes de 
varianza, ó% = 0.661 + 1.613 = 2.274, y la estimación de w? para el factor A es, aplicando la ecuación 
3.18: 0% =0.661/2.274 =.291. 

Otra cuestión de interés concierne a la potencia retrospectiva u observada de la prueba F para 
el factor A. Aplicando la ecuación 3.20 para estimar el parámetro de no centralidad obtenemos Á = 
(gl (Fa) = 2)(5.915) = 11.830. Asumiendo un nivel de significación del 5%, el valor de potencia puede 
consultarse en la tabla D del Anexo de tablas (distribución F no central), con a—1=2 grados de libertad 
para el numerador y N— a= 21 grados de libertad para el denominador y parámetro de no centralidad 
A = 11.830. El valor interpolado de potencia observada es q) = 0.824, un valor que, al ser superior a 0.80, 
se considera óptimo para detectar efectos de tratamiento. 


3.3. DIAGNÓSTICO DEL MODELO ANOVA DE UN FACTOR 


3.3.1. Supuestos del modelo 


La razón F para probar los efectos de tratamiento en el modelo ANOVA de un factor es muy flexi- 
ble y puede utilizarse en una gran variedad de circunstancias, pero requiere el cumplimiento de tres 
supuestos básicos: 


1. Supuesto de NORMALIDAD de la variable de respuesta para cada nivel del factor o tratamiento. 
La evaluación de este supuesto suele realizarse con la PRUEBA DE SHAPIRO-WILK para N < 50 
O la PRUEBA DE KOLMOGOROV-SMIRNOV con la corrección de la significación de Lilliefors para 
N > 50. Algunos estudios (p. ej., Glass, Peckham y Sanders, 1972) han demostrado que el ANOVA 
es robusto frente a violaciones de la normalidad, es decir, tiene consecuencias inapreciables sobre 
las tasas de error tipo 1 y tipo II, a menos que las poblaciones sean muy sesgadas o los tamaños 
muestrales de cada nivel del factor sean muy pequeños. 


2. Supuesto de HOMOGENEIDAD DE LAS VARIANZAS, O VARIANZA CONSTANTE de la variable de res- 
puesta para cada nivel del factor (HOMOCEDASTICIDAD). Hay muchas pruebas para evaluar este 
supuesto. Con modelos ANOVA, la prueba que se ha demostrado más conveniente es la PRUEBA 
DE LEVENE (Levene, 1960), que no es sino un ANOVA simple tomando como variable de respuesta 
los valores absolutos de las desviaciones de cada observación respecto de la media de su grupo, 
ei =1Yi;- Y), o respecto de la mediana de su grupo e;; = |Y;; — Mdn(Y;)]. En el caso de tama- 
ños muestrales iguales para cada nivel del factor, las consecuencias de la violación del supuesto 
de homogeneidad son poco relevantes, aunque más importantes que la violación de la normali- 
dad (Tomarken y Serlin, 1986). Sin embargo, en el caso de modelos con réplicas no equilibradas, 
O sea, con diferente tamaño muestral para cada nivel de factor, las consecuencias tienen mayor 
relevancia, siendo en ocasiones precisa la utilización de alguna forma de corrección. 


3. Supuesto de INDEPENDENCIA DE LAS OBSERVACIONES. Este supuesto no afecta a diseños donde los 
sujetos se asignan al azar a los tratamientos (diseños completamente aleatorios), pero sí particu- 
larmente a diseños donde todos los sujetos reciben todos los tratamientos (diseños de medidas 
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repetidas), o en general a diseños donde puede existir algún tipo de interacción entre los suje- 
tos durante la administración de los tratamientos. La evaluación del supuesto de independencia 
suele realizarse por vía lógica, examinando las condiciones bajo las cuales se administran los tra- 
tamientos. El supuesto de independencia de las observaciones requiere que las observaciones que 
se registran para cada réplica de cualquier nivel del factor no hayan sido influidas por réplicas del 
mismo nivel o de otros niveles de factor. Una prueba clásica para evaluar la independencia de los 
residuales de un modelo ANOVA es el TEST DE DURBIN-WATSON, que calcula un coeficiente de 
autocorrelación py, donde el subíndice se refiere al retardo (lag) para el cálculo de la función de 
autocorrelación entre residuales, y un estadístico que es aproximadamente DW = 2(1-— p). Valores 
de DW próximos a 2 se consideran óptimos. La potencia se consulta en las tablas I y J del Anexo 
de tablas estadísticas. 


3.3.2. Evaluación de los supuestos del modelo 


Para los datos del ejemplo 3.1, la prueba de Shapiro-Wilk para la variable de respuesta en conjunto 
es SW = 0.954, P = 0.324, lo que permite aceptar la Hy de normalidad. Para cada uno de los niveles 
del factor la aplicación de la prueba conduce al mismo resultado, ya que SW (al) = 0.931;P = 0.522, 
SW (a2) = .0900; P = 0.120 y SW (a3) = 0.966; P = 0.862. 

La aplicación de la prueba de Levene con desviación respecto de la mediana para los datos del 
ejemplo 3.1, es F(2,21) = 2.215;P = .134. La misma prueba con desviación respecto de la media es 
F(2,21) =2.244;P =.131 y por tanto en ambas circunstancias se acepta también la Ay de varianza cons- 
tante. 

La prueba de Durbin-Watson para evaluar la existencia de autocorrelación entre residuales del mo- 
delo ajustado aporta una autocorrelación de p, = —0.144 y un valor de DW = 2.167; P = .978, y por tanto 
puede también aceptarse la hipótesis nula de no autocorrelación entre residuales. 

Además de las pruebas formales de evaluación de los supuestos, es muy conveniente realizar grá- 
ficos diagnósticos para comprobar visualmente el cumplimiento de tales supuestos, aunque no suele 
practicarse en la investigación publicada. La figura 3.2 muestra un panel de cuatro gráficos diagnósticos 
obtenido con el programa R (en la misma línea que la figura 2.6 para los modelos de regresión). 


— La figura superior izquierda es un gráfico de los residuales contra los valores ajustados (Residual 
us Fitted) con el objeto de comprobar si la variación es la misma en cada grupo. Los círculos apun- 
tan que el grupo con promedio más bajo presenta mayor variabilidad que los restantes grupos, 
quizá debido a la presencia de dos puntuaciones extremas (en concreto, los casos 17 y 21). Pero la 
línea horizontal prácticamente no se desvía del cero, por lo que la variabilidad parece igual en los 
diferentes grupos, como también se constata con la prueba de Levene. 


— La figura superior derecha es un gráfico de cuantiles (Normal Q-Q plot) que permite evaluar la 
desviación de la normalidad en función del alejamiento de los puntos respecto de la recta teórica 
diagonal. Los puntos parecen desviarse poco de la recta, lo que apunta normalidad (los casos 12 y 
17 son la expepción), como también se constató con la prueba de Shapiro-Wilks. 


— La figura inferior izquierda (Scale-location) es un gráfico de valores ajustados contra residuales, 
pero con una escala diferente para los residuales. Como regla general, residuales por encima de 2 
en esta escala sugeriría heterogeneidad de las varianzas. Nótese que los valores más altos (casos 
17 y 21) no superan el valor límite de 1.5. 
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— La figura inferior derecha (Constant leverage: Residuals vs Factor Levels) aporta más información 
sobre puntos individuales facilitando la detección de puntuaciones extremas. Las puntuaciones 
inusuales corresponden a los casos 12 (para el segundo nivel del factor) y 17 y 21 (para el tercer 
nivel), pero la aproximación de la recta central (para los tres niveles de factor) al valor O sugiere 
que no son en absoluto observaciones influyentes. 


Residuals vs Fitted Normal Q-Q 
cm — 
017 170 
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Constant Leverage: 


Scale-Location Residuals vs Factor Levels 
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Fitted values Factor Level Combinations 


Figura 3.2. — Gráficos diagnósticos para el modelo ANOVA de un factor. 


En el ejemplo 3.1, donde se emplea el mismo número de casos por nivel de factor (o sea, es un 
modelo equilibrado), los efectos de la heterocedasticidad no tienen mayor relevancia, como muchos 
estudios han revelado. Pero en el caso de modelos no equilibrados es necesario corregir la presencia de 
heterocedasticidad. Trataremos dos métodos básicos para efectuar tal corrección, En primer lugar, los 
procedimientos de Welch (1951) y de Brown y Forsythe (1974), que proponen estadísticos alternativos 
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a la prueba F a aplicar en el caso de heterocedasticidad (véase Vallejo, Fidalgo y Fernández, 2001), y en 
segundo lugar, el empleo de la TRANSFORMACIÓN BOX-COX para la variable de respuesta, que consis- 
te en transformar la variable de respuesta original en una nueva variable para corregir problemas de 
heterocedasticidad. 

Cuando los supuestos de varianza constante y de normalidad se violan y no pueden ser corregidos, el 
investigador puede en última instancia recurrir a utilizar o bien MÉTODOS ROBUSTOS (véase Ercg-Hurn 
y Mirosevich, 2008), o bien PRUEBAS NO PARÁMETRICAS O de distribución libre, que no requieren asu- 
mir el supuesto de normalidad (véase Sheskin, 2011). Para el modelo ANOVA de un factor, la PRUEBA DE 
RANGOS DE KRUSKAL-WALLIS (KW) es la opción más recomendable, porque es idéntica al análisis de 
varianza con las observaciones reemplazadas por rangos. El estadístico KW se distribuye aproximada- 
mente como e con a— 1 grados de libertad. Para los datos del ejemplo 3.1, aa) =8.377, P=.015, lo 
que conduciría a una conclusión similar. En estos casos, una medida de magnitud del efecto recomen- 
dable es la DELTA DE CLIFF (Véase Macbeth et al., 2011). 


3.3.3. Los estadísticos de Welch y Brown-Forsythe 


Welch (1951) propuso un procedimiento para probar el efecto de tratamiento para un factor en pre- 
sencia de heterocedasticidad con modelos no equilibrados. Consiste en una simple modificación de la 
razón F del ANOVA, que se obtiene aplicando 


(Y, - Y? 
2 E 1 
PA 
a2-1 
donde Y es un factor de corrección contra la heterocedasticidad definido como 
2 
a ww 
2¡wj 
0=) == SAL (3.22) 
F nj- 1 


El estadístico Fyy se distribuye según F con gl; = a—1 y gl, = (a?—1)/30. La extensión a más de un factor 
fue derivada por Algina y Oleknik (1984). Para los datos del ejemplo 3.1, Fy (2, 13.403) = 6.801; P =.009, 
permitiendo rechazar la hipótesis nula de igualdad de medias de grupo. 

Aunque menos conocido, un procedimiento más simple y más aconsejable, derivado de la prueba 
de Levene con desviación respecto de la mediana, es el estadístico Brown-Forsythe, con fórmula 


E¡nj(Yj- YY 


z, ( E 7) 2 (3.23) 


Fapr= 


que tiene también una distribución F aproximada con gl; =a—-1ygl2=2; c5/ (n;—1), donde 
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o 
cj= S ral (3.24) 
ali e 

J an) 


El estadístico Far (2, 16.277) = 5.915; P = .012 permite rechazar la hipótesis nula de igualdad de me- 
dias de grupo en condiciones de violación severa de la homocedasticidad. Algunas aplicaciones de este 
procedimiento y extensiones a situaciones más complejas pueden consultarse en varios trabajos de Va- 
llejo y Ato (2006, 2012), Vallejo, Fernández y Livacic-Rojas (2010) y Vallejo, Ato y Fernández (2010). 


3.3.4. Transformación de potencia para la variable de respuesta 


Un método alternativo para corregir la presencia de no normalidad y heterocedasticidad consiste 
en utilizar alguna transformación de los datos. Se han sugerido varios tipos de transformación de una 
variable de respuesta original (Y) en una nueva variable de respuesta (Y”) para corregir estas anomalías. 
Entre los más procedimientos más usuales con modelos ANOVA cabe destacar: 


— la transformación logarítmica (Y, = log(Y;)), que se utiliza cuando las desviaciones típicas de los 
niveles de factor son proporcionales a sus medias, 


— la transformación de la raíz cuadrada (Y; = VY;), que se utiliza cuando las varianzas son propor- 
cionales a sus medias, 


— la transformación arco-seno o angular E = arcsin (Y;)), que se utiliza cuando la variable de res- 
puesta son proporciones y en general cuando existe relación entre las varianzas y sus medias, y 


— la transformación recíproca (Y; = 1/Y;), que se utiliza cuando la variable de respuesta presenta 
valores extremos. 


Muchas transformaciones son casos particulares de una familia de TRANSFORMACIONES DE POTEN- 
CIA, formulada por Box y Cox (1964), que se propone para encontrar un valor de potencia apropiado para 
transformar la variable de respuesta original con el objeto de remediar las desviaciones de los supuestos 
del modelo lineal. Puesto que la variable de respuesta del ejemplo 3.1 cumple con todos los supuestos, 
con el objeto de ilustrar el procedimiento Box-Cox, cambiaremos un valor de la variable de respuesta 
rend para forzar la violación del supuesto de varianza constante. Llamaremos a la variable de respuesta 
modificada rend1. Por ejemplo, cambiamos el caso 12, para el que originalmente rend= 7, por rendl= 5, 
dejando el resto de los casos iguales. Si aplicamos ahora la prueba de Levene con desviación respecto de 
la media sobre la variable rend1 con el caso 12 cambiado obtenemos F(2,21) = 4.212; P = .029, apuntan- 
do que existe heterocedasticidad (la variable de respuesta original rend no presentaba problemas de he- 
terocedasticidad). La figura 3.3 aplica entonces el procedimiento Box-Cox sobre la variable de respuesta 
modificada rend1, donde se observa que el valor máximo que alcanza el parámetro de transformación 
A dentro del intervalo de confianza del 95%, es aproximadamente 1.4. 

Una vez determinado el valor óptimo de potencia para corregir el problema de heterocedasticidad, 
creamos entonces una nueva variable de respuesta objeto de la transformación, que llamaremos nrendl, 
que se obtiene simplemente elevando a la potencia 1.4 las puntuaciones de rendl, o sea, nrendI=rend1!*, 
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Si se aplica de nuevo la prueba de Levene con desviación respecto de la media a la variable de respues- 
ta transformada nrendl1, se obtiene F(2,21) = 3.349; P = .058, lo que nos permite aceptar la hipótesis 
nula de varianza constante. Por tanto, la transformación Box-Cox con 1 = 1.4 sobre nrend ha logrado 
homogeneizar la varianza de una variable (nrend) que violaba el supuesto de homocedasticidad. 


log-Likelihood 
-10 


-15 


-20 


Figura 3.3. — Transformación de potencia sobre la variable nrend. 


3.4. ANÁLISIS POST-HOC 


En el marco del ANOVA de un factor con efectos fijos, una prueba F global significativa solamente 
demuestra que al menos una diferencia entre las medias del factor es significativa. Pero el investigador 
suele desconocer de qué diferencia se trata. Por esta razón, después de demostrar que existen diferen- 
cias significativas entre los niveles del factor mediante la prueba F, el interés del investigador suele 
concentrarse en determinar qué diferencias entre medias de tratamiento son las responsables de la sig- 
nificación (COMPARACIONES MÚLTIPLES ENTRE MEDIAS DE GRUPO) o bien, si el factor tiene naturaleza 
ordinal, en describir la tendencia que siguen las medias (ANÁLISIS DE TENDENCIAS). 


3.4.1. Comparaciones múltiples entre medias de grupo 


Un contraste o comparación entre medias es una combinación lineal de a medias de un factor A 
definida como 
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a 
Y=cY ¡+0 Y2+...+c¡Yj+...+CaYa=D cjY j (3.25) 
j=1 


donde c; son los coeficientes del contraste. Cuando todos los coeficientes excepto dos son cero, se trata 
de una COMPARACIÓN PAREADA; en cualquier otro caso se trata de un contraste complejo que implica 
cualquier comparación lineal entre medias. Así, para un ANOVA con 3 niveles de factor hay un total de 
[()(a—= 1)1/2= (3x2)/2 =3 comparaciones pareadas, en concreto: 


YN = EDY+EDY2+(0Y3=Y1-Y2 
Y = E+DY1+(0Y2+EDY3=Y¡-Y3 
a = (0QY1+G4DY2+EDY3=Y>-Y3 


pero caben otras muchas combinaciones lineales, además de las anteriores; por ejemplo, 


Ñ Yi+Ya 5 

Va = (1/2Y1+(/2Y2+-DY3= 2 Y3 
A = = = Y +2Y3 = 
Vs = a dd le 


Cuando se planifica un experimento, un investigador tiene in mente un conjunto específico de com- 
paraciones. Distinguimos entre COMPARACIONES A PRIORI O PLANIFICADAS y COMPARACIONES A POSTE- 
RIORI O NO PLANIFICADAS, en función de si las comparaciones se realizan antes o después de obtener la 
prueba F global del análisis de varianza. 

Una cuestión básica cuando se utilizan dos o más comparaciones entre medias concierne a la pro- 
babilidad de error tipo I. Cuando sólo es posible una comparación (p.e., en el caso de un factor con dos 
niveles), la probabilidad de cometer un error tipo l es el nivel de significación (a) y la probabilidad de no 
cometerlo es 1— a. Cuando hay más de una comparación, por ejemplo C comparaciones, la situación 
es algo más complicada. Si cada una de ellas se establece al nivel de significación a, la probabilidad de 
cometer uno o más errores de tipo 1 es 1 — (1— ae que es aproximadamente igual a Ca para pequeños 
valores de a. Una FAMILIA DE COMPARACIONES es un conjunto de contrastes relacionados. Por ejem- 
plo, el conjunto de contrastes posibles que implican un grupo de control y dos grupos de tratamiento 
constituyen una familia de comparaciones. 

La selección de un procedimiento de comparación múltiple es una tarea compleja que requiere con- 
trolar muchos aspectos. Para simplificar esta situación, se recomienda utilizar VALORES DE P AJUSTADOS 
(Rosenthal y Rubin, 1984), es decir, valores corregidos de P que sustituyen a los valores de P observados 
resultantes de una comparación entre dos o más medias de grupo con algún estadístico clásico (por 
ejemplo, la £ de Student), para tomar la decisión acerca de si tal comparación es o no estadísticamente 
significativa. Las claves de esta situación son la utilización de una distribución conocida (por lo general, 
la distribución de £ de Student) y el control efectivo de la tasa de error por familia de comparaciones «f. 

El procedimiento más simple para obtener valores de P ajustados es el AJUSTE DE BONFERRONI, que 
consiste simplemente en transformar valores observados de probabilidad en valores ajustados en fun- 
ción del número de comparaciones realizadas. Por ejemplo, supongamos que un investigador planifica 
5 comparaciones pareadas al nivel a = 0.01, y obtiene valores empíricos de P para cada comparación 
aplicando una prueba clásica de t. El ajuste de Bonferroni transforma los valores empíricos de P en 
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valores ajustados multiplicando los valores empíricos de P por el número de comparaciones que se 
desea realizar. Así, si el valor de P observado es 0.0059 (y por tanto la comparación sería significativa 
con a =.01), el valor ajustado será Pronf = (.0059)(5) = .0295, y la diferencia entre medias no sería sig- 
nificativa al nivel a = 0.01. Este procedimiento controla efectivamente la tasa de error por familia de 
comparaciones y garantiza que 4pp = a si todas las comparaciones son válidas en la población. Los in- 
convenientes que se le achacan a este procedimiento son, en primer lugar, que tiene lugar en una única 
etapa, y en tal caso el control de la tasa de error por familia implica que cuanto mayor es el número de 
comparaciones, más pequeña será la potencia para probar una comparación individual, y en segundo 
lugar, que produce valores de P ajustados excesivamente conservadores. 

Hay muchos procedimientos de comparación múltiple entre medias de tratamiento (Hochberg y 
Tamhane, 2009; Hsu, 1996; Kirk, 2013; Shaffer, 1995). El paquete SPSS puede generar dos formas de 
presentación: las COMPARACIONES MÚLTIPLES PAREADAS y las PRUEBAS DE RANGO POST-HOC. Las com- 
paraciones múltiples pareadas contrastan la diferencia entre cada par de medias generando una matriz 
con todas las comparaciones posibles y determinando para cada una su probabilidad. Las pruebas de 
rango post-hoc identifican subconjuntos homogéneos de medias que no se diferencian entre sí. Para 
el ejemplo 3.1 las comparaciones múltiples pareadas entre las medias del factor difse muestran en la 
salida 3.3 para el procedimiento DHS de Tukey (consúltense detalles en Ato y Vallejo, 2007, p.166-172). 


SALIDA 3.3 
Comparaciones pareadas con el procedimiento DHS de Tukey 


Variable dependiente: rend 


Diferencia Límites IC 95% 
(-D Inferior | Superior 

1.500 E 0.101 3.101 

2.125 M 0.524 3.726 


1.500 a -3.101 1.075 
0.625 E 0.976 2.226 
-2.125 h 3.726 0.524 
0.625 E -2.226 0.976 


La salida 3.3 reporta todas las diferencias entre pares de medias, los errores típicos, el nivel de signi- 
ficación y el intervalo de confianza en torno al 95% para cada comparación. El interés se concentra en la 
columna P, que representa valores de probabilidad ajustados, o en las columnas correspondientes a los 
límites del Intervalo de Confianza del 95%. El procedimiento DAS de Tukey detecta diferencias signifi- 
cativas entre las medias alta y baja del factor difcon P = .008, pero no con el resto de comparaciones. 

La salida 3.4 presenta las pruebas de rango post-hoc con el mismo procedimiento de la salida 3.3. 
Las pruebas de rango permiten detectar la presencia de subconjuntos homogéneos de medias que no 
difieren entre sí y pueden considerarse iguales desde un punto de vista estadístico. 


SALIDA 3.4 
Pruebas de rango con el procedimiento DHS de Tukey 
Variable dependiente: rend 
Subconjunto 
Prueba dif 1 

DHS Tukey alta 4.375 

media 5.000 

baja 

Probabilidad | .595 
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Para los datos del ejemplo 3.1 se detectan dos subconjuntos, cada uno de los cuales presenta las 
medias a las que afecta. El primer subconjunto indica que no existen diferencias entre las medias 'alta' 
y 'media', con probabilidad P = .595. El segundo subconjunto indica que no existen diferencias entre 
las medias 'media' y "baja, con probabilidad P = .069. En consecuencia, hay una diferencia de medias 
(en concreto, la diferencia entre 'alta' y 'baja' que no se ha detectado en ningún subconjunto), que es 
estadísticamente significativa. Es importante comparar la salida de los dos procedimientos de compa- 
ración y constatar que ambas producen información similar con un formato diferente, pero de forma 
más simplificada en la salida 3.4 que en la salida 3.3. 


3.4.2. El análisis de tendencias 


En el ejemplo 3.1 la variable explicativa difes un factor nominal. Muchos paquetes estadísticos uti- 
lizan por defecto codificación de efectos para codificar un factor nominal en un modelo ANOVA. Pero 
en otras ocasiones la variable explicativa es un factor ordinal, de naturaleza cuasicuantitativa o incluso 
una variable cuantitativa discreta. En tal caso, los paquetes estadísticos codifican por defecto los niveles 
del factor ordinal con codificación polinómica ortogonal, que descompone el factor en un conjunto de 
tendencias de primer orden (lineal), de segundo orden (cuadrática), de tercer orden (cúbica), etc. Con 
un factor ordinal las comparaciones entre medias de grupo carecen de interés para concentrarse en la 
tendencia que siguen los datos empíricos. El resultado es el ANÁLISIS DE TENDENCIAS (trend analysis). 

El ejemplo 3.2 es un experimento realizado para estudiar el recuerdo en una muestra de 24 niños 
que fueron asignados al azar a 4 condiciones experimentales en función del periodo fijo de tiempo que 
se les permitió estudiar una lista de 12 palabras (tiempos de exposición de 1, 2, 3 y 4 minutos). La varia- 
ble de respuesta fue el número de palabras correctamente recordadas después de superar una tarea de 
interferencia (variable recu). La variable independiente es el periodo de tiempo de exposición de la lista 
para su estudio (factor tiempo). Obsérvese que el factor tiempo no es una variable numérica continua, 
porque en el contexto en que se utiliza aquí no puede adoptar valores intermedios, sino que se trata de 
una variable numérica discreta. 

El cuadro 3.7 presenta los datos empíricos originales, en el formato ya conocido de casos (filas) por 
variables (columnas). 


CUADRO 3.7 
Datos empíricos del ejemplo 3.2 


tiempo 
2 


La salida 3.5 representa el correspondiente análisis descriptivo que incluye, para cada uno de los 
niveles del factor tiempo, las medias, sumas (brutas), varianzas y tamaños muestrales, o sea, toda la 
información necesaria para abordar la descomposición de la variación del modelo. 
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SALIDA 3.5 
Análisis descriptivo de recu para cada nivel de tiempo 
Variable dependiente: recu 


La figura 3.4 presenta los promedios del factor tiempo con representación de las barras de error al 
nivel del 95%. Obsérvese que los promedios presentan un crecimiento monotónico, pero no constante 
de un nivel de factor al siguiente, apreciándose una cierta desviación de la linealidad, y alta similaridad 
de las barras de error para los diferentes niveles del factor, lo que permite deducir que con estos datos 
empíricos probablemente se satisface el supuesto de homogeneidad de las varianzas. 

Aplicando el procedimiento de cálculo simplificado para el ANOVA de un factor (siguiendo la es- 
tructura presentada en el cuadro 3.1), el cuadro 3.8 resume todo el proceso de cálculo de las cantidades 
básicas y de las sumas de cuadrados. La tabla ANOVA resultante se presenta en la salida 3.6, donde 
F4(3,20) = 19.828; P < .001. El desarrollo del análisis de tendencias asume significativa la prueba F glo- 
bal del modelo ANOVA. 


10.0- 


a 
un 
1 


recu 


1) 
un 
1 


tiempo 


Figura 3.4. — Gráfico de medias de recu con barras de error al 95%. 
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CUADRO 3.8 
Descomposición de la variación del modelo ANOVA del ejemplo 3.2 


Cantidades básicas Fórmulas de cálculo No términos 
1)=7?2/N (150)? /24 = 937.5 1 

[A] =E A5/n (122 /6) + (36? /6) + (48/6) + (542 /6) = 1110 4 

[R] = En; DSi (5)(2+3.2+4.4+2)=58 | (5)(4) =20 
Sumas de cuadrados Fórmulas de cálculo G. libertad 
SCaA=[4)- [1 1110-937.5=172.5 gla=3 
SCr=|[R] 58 glr=20 
SCy = [4] - [1] 1110-937.5= 172.5 glm=3 
SCr = [4] +[R] - (1] 1110+58-—937.5= 230.5 glrT =23 


SALIDA 3.6 
Tabla ANOVA del modelo ANOVA de un factor 


Variable dependiente: recu 
Fuentes SC tipo HI 
Modelo 172.500 

A (tiempo) 172.500 
Residual 58.000 

Total 230.500 


Cuando la variable es cuantitativa discreta u ordinal y la prueba F estadísticamente significativa, 
como sucede en este caso, no tiene ningún sentido aplicar comparaciones múltiples entre medias de 
grupo. En su lugar, el análisis de tendencias permite comprender la naturaleza de la relación entre factor 
y variable de respuesta, si la relación es lineal o no lineal, y en el caso de no ser lineal, identificar la forma 
general de la relación. 

El análisis de tendencias utiliza codificación polinómica, que requiere un tipo de contrastes, llama- 
dos CONTRASTES ORTOGONALES, cuyos coeficientes c; se toman de una TABLA DE POLINOMIOS ORTOGO- 
NALES (véase tabla F en el Anexo de tablas estadísticas) y son apropiados para descomponer la tendencia 
que siguen las medias de la variable de respuesta para cada uno de los niveles del factor. Una interesante 
propiedad de este tipo de contrastes es que los vectores numéricos que genera son mutuamente inde- 
pendientes (o sea, ortogonales) entre sí. La expresión general para un factor A con aniveles requiere a—1 
vectores numéricos, cada uno de los cuales representa un componente de la tendencia. Así, el primer 
componente representa la tendencia lineal, que tiene una forma de línea recta y requiere un polinomio 
de primer grado. El segundo componente representa la tendencia cuadrática, que tiene forma de U (o de 
U invertida) y requiere un polinomio de segundo grado. El tercer componente representa la tendencia 
cúbica, que tiene forma sinusoidal y requiere un polinomio de tercer grado. Ejemplos ficticios de ajuste 
perfecto de las tendencias lineal, cuadrática y cúbica se presentan en la figura 3.5. 

El análisis de tendencias determina qué polinomio se precisa para ajustar la tendencia que siguen 
las medias de la variable de respuesta para cada uno de los niveles del factor. Si la tendencia es emi- 
nentemente lineal, sólo será significativo el componente lineal, pero no los restantes componentes. Si 
la tendencia no es lineal, se puede averiguar si es eminentemente cuadrática (en cuyo caso sólo será 
significativo el componente cuadrático, pero no los restantes) o es híbrida, es decir, en parte lineal y en 
parte cuadrática. Lo mismo se aplica en casos más complejos. 
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La prueba de la existencia de una tendencia lineal requiere al menos 2 niveles de factor y se ajusta 
con un polinomio de grado 1, la tendencia cuadrática requiere 3 niveles de factor y se ajusta con un 
polinomio de grado 2, la cúbica requiere 4 niveles de factor y un polinomio de grado 3. Para el ejemplo 
3.2, con cuatro niveles para el factor tiempo, es posible ajustar hasta una tendencia cúbica. 


Lineal ES NX 
Cuadrática A 
Cúbica PY) 


Figura 3.5. — Ejemplos de tendencia lineal, cuadrática y cúbica. 


Para realizar un análisis de tendencias se requiere conocer los coeficientes c; de los polinomios or- 
togonales para los niveles de factor menos uno. Se obtienen consultando la tabla F y se muestran en 
el cuadro 3.9 para las medias de grupo del ejemplo 3.2. Obsérvese que cada uno de ellos representa su 
propia tendencia. Así, los coeficientes de la tendencia lineal son [-3, —1, 1, 3], que representan una línea 
recta, los de la tendencia cuadrática son [1, —1, —1, 1], que representan una curva en forma de U, y los de 
la tendencia cúbica son [—1, 3, —3, 1], que representan una curva sinusoidal. El cálculo de los contrastes 
y se obtiene sumando los productos de los códigos c; por los promedios de los niveles del factor Y ¡Y 
dividiendo por la raíz cuadrada de la suma cuadrática de los códigos (última fila del cuadro 3.9). 


CUADRO 3.9 
Coeficientes polinómicos y estimadores de la tendencia 


Coeficientes c j 
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Medias Y ; 


Lineal 


Cuadrático 


Cúbico 


J 
2.000 
6.000 
8.000 


9.000 


=3 
-1 
1 
3 


1 
-1 
-1 


-1 


23 


v20= 4.4721 


v20= 4.4721 


5.143 


0.224 
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En la salida 3.7 se resume el análisis de varianza con los tres componentes de la tendencia del factor 
tiempo. En contraste con la salida 3.10 del ANOVA tradicional, el formato de esta salida consiste en 
dividir jerárquicamente cada término en dos partes: lo explicado por el componente (Contraste) y lo 
no explicado (Desviación). Cada componente explicado toma como error la SC Residual, como sucede 
con todos los efectos fijos. Así, la SC explicada por el factor tiempo se divide en una parte explicada 
por el componente lineal (SC, = 158.7, con P < .001) y otra parte no explicada (SCy — SC, = 13.8). De 
la porción no explicada por el componente lineal se desgaja una parte explicada por el componente 
cuadrático (SCc = 13.5, con P < .05) y otra parte no explicada (SCy — SC, — SCc = 0.3). Puesto que no 
caben más componentes de la tendencia, el componente cúbico se atribuye lo que no está explicado por 
el componente cuadrático (0.3, con P = .751). En consecuencia, se considera significativa la tendencia 
lineal y la tendencia cuadrática, pero no es significativa la tendencia cúbica. 


SALIDA 3.7 
ANOVA y componentes de la tendencia 


Fuentes SC tipo III MC 
tiempo 172.500 57.500 
Lineal Contraste 158.700 158.700 
Desviación 13.800 6.900 
Cuadrático Contraste 13.500 13.500 


Desviación 0.300 .300 
Cúbico Contraste 0.300 .300 
Residual 58.000 2.900 
Total 230.500 


3.5. MODELOS ANOVA CON MÁS DE UN FACTOR 


Cuando se combinan dos o más factores de tratamiento o de clasificación el modelo resultante se 
denomina MODELO ANOVA FACTORIAL. Respecto al ANOVA de un factor, su peculiaridad es que no só- 
lo permite evaluar el efecto individual de cada uno de los factores (llamados en este contexto EFECTOS 
PRINCIPALES O MARGINALES), sino también el efecto conjunto de dos o más factores (llamados EFECTOS 
INTERACTIVOS), que se distinguen entre sí por el número de factores implicados. Así, los EFECTOS INTER- 
ACTIVOS DE PRIMER ORDEN conciernen a efectos que implican dos factores, los EFECTOS INTERACTIVOS 
DE SEGUNDO ORDEN conciernen a efectos que implican tres factores, y en general, los EFECTOS INTER- 
ACTIVOS DE k—ÉSIMO ORDEN conciernen a efectos que incluyen k+ 1 factores. En esta sección desarro- 
llamos los modelos ANOVA de dos y tres factores, y por tanto trataremos solamente efectos interactivos 
de primero y segundo orden. 

Dependiendo de la relación que se establece entre los factores implicados, suele también distinguir- 
se entre dos formas de clasificación. En los MODELOS DE CLASIFICACIÓN CRUZADA se observan todas las 
combinaciones de tratamiento. Este tipo de modelos se caracteriza porque, además del efecto principal 
de cada uno de los factores, puede incluirse también (si resulta significativo) un efecto de interacción 
(en cuyo caso se trata de un MODELO INTERACTIVO) o no incluirse (y entonces es un MODELO ADITIVO). 
Así, en un modelo de clasificación cruzada con dos factores, que llamaremos A y B, el modelo interac- 
tivo tiene dos efectos principales (A y B) y un componente de interacción (A x B). En los MODELOS DE 
CLASIFICACIÓN ANIDADA no se observan todas las combinaciones de tratamiento. Este tipo de modelos 
se caracteriza porque uno de los efectos principales se funde con el efecto de interacción. Así, en un 
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modelo de clasificación anidada con dos factores hay un efecto principal (p. ej., A) y un segundo efecto 
principal que se anida en el primero [B(4)] y que incluye también el componente de interacción (Ax B). 

Los modelos ANOVA de clasificación cruzada de dos o más factores se diferencian entre sí por el 
número de tratamientos de cada factor, que se etiqueta con letras latinas minúsculas. Una notación ge- 
neral que se emplea para distinguirlos es simplemente el producto de los niveles de cada factor. Con los 
modelos factoriales se emplea el término COMBINACIONES DE TRATAMIENTO O DE CLASIFICACIÓN para 
capturar la naturaleza de una combinación factorial de niveles de factor. Así, un modelo ANOVA con 2 
factores tiene ax b combinaciones de tratamiento y un modelo con 3 factores tiene ax bx c combinacio- 
nes de tratamiento. De forma más concreta, se puede también expresar el modelo utilizando el número 
de niveles de tratamiento o de clasificación. Por ejemplo, en un modelo de clasificación cruzada con dos 
factores, cada uno de los cuales tiene 3 niveles de tratamiento, se emplea la notación 3 x 3, o bien 32. Una 
presentación usual de este caso se presenta en el cuadro 3.10. Para cada casilla en el extremo superior 
izquierdo se muestra el promedio u ¡z de cada combinación factorial, donde ¡ se refiere a cualquiera de 
los a niveles del factor A y k se refiere a cualquiera de los b niveles de factor B, y en el extremo inferior 
derecha el número de réplicas (n) para cada combinación factorial. 


CUADRO 3.10 
Modelo ANOVA de clasificación cruzada 3 x 3 


3.5.1. Modelos ANOVA de dos factores 


Suponiendo dos factores, que llamaremos A y B, con ax b combinaciones de tratamiento, para cada 
una de las cuales se observan un total de n réplicas, el modelo más completo para analizar las N= abn 
observaciones se formula con cualquiera de las dos ecuaciones 


Yijk = jr + ij 


(3.26) 
Yijk=4+0j+ Pr +(0B)jr + ij 


donde 


— Y¡;x es el valor observado de la variable de respuesta para la ¡-ésima réplica de la ¡k-ésima com- 
binación de tratamiento. 
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— ¡pes la respuesta esperada global, que es constante para todas las combinaciones de tratamiento 
y todas las réplicas. 


— Bjr=p4+0;+ fp + (06) ;z (para ¡=1,2,...,a y k=1,2,..., b) es la respuesta esperada para la ¡k- 
ésima combinación de tratamiento. 


— 4¡=Hj¡- pes el efecto del ¡-ésimo tratamiento del factor A, que se supone constante (prefijado 
por el investigador) para todas las réplicas dentro de un tratamiento pero que puede diferir para 
diferentes tratamientos. 


— Br = HH es el efecto del k-ésimo tratamiento del factor B, que se supone constante (prefijado 
por el investigador) para todas las réplicas dentro de un tratamiento pero que puede diferir para 
diferentes tratamientos. 


— (46) jx = Hjx — Hj— Mx + y es el efecto de la interacción entre el ¡-ésimo nivel de A y el k-ésimo 
nivel de B. Es en realidad lo que queda por explicar de los promedios de tratamiento 4; que no 
explican conjuntamente y, ; y Pz. 


— €ijk= Yijk— Mjx es el residuo o error experimental que corresponde a la ¡-ésima réplica de la ¡k 
combinación de tratamiento. Se asume que los residuales se distribuyen normal e independien- 
temente, €jjk NID(0, a?). 


El modelo de efectos fijos asume que los efectos a; y fz son constantes fijas, o sea, han sido pre- 
fijadas por el investigador y por tanto la generalización de los resultados no podrá extenderse más allá 
de los tratamientos empleados para definir cada efecto. En consecuencia, los modelos ANOVA de dos 
factores de efectos fijos tienen solamente una variable aleatoria, correspondiente a la varianza residual 
o de error, ae 

Los estimadores de los parámetros del modelo ANOVA con dos factores se obtienen mediante esti- 
mación por mínimos cuadrados ordinarios (OLS) y se presentan en el cuadro 3.11. 


Parámetros | Estimadores 


p Y 
Y ¡-1) 


YY) 
(Mi Rd) 
Vik Y jr) 


Sustituyendo en la ecuación 3.26 parámetros por estimadores obtenemos: 


Yijk= Y+(Y¡-VD+(Y:-VO+(V ¡Y ¡-Yx+ Y) + (Vi je Y ¡1) (3.27) 


lo que, eliminando paréntesis, es una simple identidad. Trasladando a la izquierda el primer término de 
la derecha transformamos todos los componentes a una misma escala de puntuaciones diferenciales 


Vi V = (Y DAY iD A Y ¡Y it VO A (Vie Y 1) (3.28) 
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y elevando al cuadrado, sumando para todo i, j y k, y presuponiendo réplicas equilibradas, obtenemos: 


NANA Dn A Vs an A Mn YAA Y ¡Y DADO Y jp 
k ji q k k j k ji 


SCT = SCA + SC + SCAB + SCr 


(3.29) 


La ecuación 3.29 expresa la descomposición de la SC Total (SC7) en los dos componentes de todo 
modelo lineal: la SC Explicada por el modelo (SCyy) y la SC no explicada por el modelo (SCr). En el 
modelo ANOVA de dos factores, la SC se descompone a su vez en los términos siguientes: 

— SC, es la suma de cuadrados del efecto principal o marginal de A; 
— SCp es la suma de cuadrados del efecto principal o marginal de B; 


— SCag es la suma de cuadrados del efecto interactivo entre A y B. 


Las fórmulas de cálculo para el ANOVA con dos factores, asumiendo réplicas equilibradas, siguen la 
misma lógica que las del ANOVA de un factor y se exponen en el cuadro 3.12. 


CUADRO 3.12 
Descomposición de la variación y fórmulas de cálculo ANOVA de 2 factores 


Cantidades básicas Fórmulas de cálculo No términos 
[1] : Corrección media D=0 Y?/N 1 
[A] : Marginales de A A J=Y AG! bn a 
[B] : Marginales de B Bl=Y Bilan b 
[AB] : Marginales de AB ABI=YY ABS, /n ab 
[R] : Residuales Rl=Yk ¡(Mix - DSi (n- D(ab) 
Sumas de cuadrados Fórmulas de cálculo G. libertad 
SCA=nbY ¡dí AJ- (1 gla=a-1 
SCg =naYEx bi B]- [1 gla=b-=1 
SCag =NExE ¡(Apr AB]|-[4]-[B]+[1] glag=ab-a-b+1 
SCr=Ex2 ¡Erie Y 1d? R] glr=N-ab 
SCm =Ex E ¡(Y jr Y)? AB]- (1 glm=ab-1 
SCr=YEK*E¡Ei(Yi jr - Y? AB] +[R]-[1) glr=N-1 


Las medias cuadráticas se obtienen, como es usual, dividiendo sumas de cuadrados y grados de 
libertad, siendo sus respectivas esperanzas matemáticas: 
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nbY; 0% 
E(MC) = 0%+ a 0% +nb0%, (3.30) 
naY y P? 
E(MCg) = 0%+ pe =02+na0% (3.31) 
NE ¡(ap 
E(MCag) = 0%4+ am =0+10%, (3.32) 
E(MCR = 0% (3.33) 


donde a, A y e, $ SOn Cuasivarianzas que resultan de prefijar un número finito de tratamientos. 

Finalmente, las pruebas F se obtienen utilizando las esperanzas matemáticas de tal modo que el 
resultado de la prueba permita evaluar si la Ay se cumple o no. Así, para probar el efecto de A se divide 
MC, con esperanza matemática E(MCA) = ve + nbé%, contra MCr, con esperanza E(MCp) = a?. Si 
a; =0, entonces E(MC4)/E(MCp) = 1, y si a; % 0, entonces E(MCa)/E(MCr) > 1. En consecuencia, 
utilizando medias cuadráticas empíricas, las razones F para un modelo de efectos fijos se construyen 
siempre dividiendo la MC del factor por la MC: 


_MCa mp. MC _ MCag 


= = = 3.34 
MCr A MCr ed MCr ) 


A 


El ANOVA de dos factores que se ha descrito hasta aquí puede considerarse completo porque in- 
cluye todos los efectos factoriales posibles. Se denomina MODELO INTERACTIVO O también MODELO NO 
ADITIVO por incluir el componente de interacción (A x B, o simplemente AB), además de los efectos 
principales de A y B. Sin embargo, conviene contemplar este modelo dentro de una jerarquía de mode- 
los donde se cuestiona cuál es el modelo que mejor se ajusta a los datos empíricos. Respecto del modelo 
interactivo, o modelo [AB], otros modelos más restringidos del ANOVA de dos factores son: 


— El modelo que incluye sólo los efectos principales de A y B, pero no la interacción. Se denomina 
por esta razón MODELO ADITIVO o modelo [A,B] y se formula: Y; =1+ 0 + Pr +jjr. 


— El modelo que no incluye ninguno de los efectos principales ni el efecto interactivo. Como es obvio 
el resultado es el MODELO NULO, o modelo [1]: Y¡¡x = 4 +€;jk. 


3.5.2. El concepto de interacción 


Lo que diferencia el modelo aditivo del modelo interactivo es la presencia de INTERACCIÓN. En tér- 
minos generales, la interacción entre dos factores se refiere al efecto sinérgico que produce la combina- 
ción de ambos factores. Un símil químico permitirá aclarar esta idea: la combinación de una parte de 
oxígeno y dos de hidrógeno produce un compuesto (agua) que posee propiedades que no tienen cada 
uno de los elementos que lo componen. Una interpretación recomendable de la interacción es como 
un efecto de moderación (Whisman y McClelland, 2005), donde el efecto que un factor (p. ej., A) tiene 
sobre la variable de respuesta depende del nivel del otro factor (B). En el marco del análisis de varianza, 
la interacción es aquella parte de la varianza de la variable de respuesta que no puede explicar los efec- 
tos principales tomados individualmente y que se atribuye al efecto conjunto. Para explicar con mayor 
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detalle este concepto nos serviremos de las tres tablas de medias del cuadro 3.13, que representan tres 
situaciones diferentes de interacción, que llamaremos "situación 1”, 'situación 2” y 'situación 3”, y que in- 
volucran un factor A, con 2 niveles, y un factor B, con 3 niveles, siendo Y como variable de respuesta. 
En la primera situación se ajusta un modelo aditivo; en las restantes se ajusta un modelo interactivo. 


CUADRO 3.13 
Medias de Y para tres diferentes escenarios de interacción 


Situación 1 Situación 2 Situación 3 

b2 | b3 Media b2 | b3 Media b2 | b3 Media 
6 ys 6 4 7 Y 
8 9 6 8 5 7 
li 8 6 6 6 7 


La situación de no interacción se deduce cuando las diferencias entre las medias de las casillas de 
una misma fila o columna son iguales para las restantes filas o columnas. Con las medias de la situación 
1, la diferencia entre las casillas a1 y a2, para b1 (o sea, 2-— 4 = —2) es la misma que para b2 (6-8 =-2) 
y para b3 (7 — 9 = —2) y por tanto también la misma que sus medias marginales (5— 7 = —2). Del mismo 
modo las diferencias entre las casillas b1, b2 y b3, para al (2-6 = -4 y 6-7 =—1) son iguales a las 
diferencias para a2 (4-8=-4y8-9=-1) y a sus medias marginales (3-7 =-4 y 7-8=-—1). Cuando 
ésto ocurre no existe interacción. En un GRÁFICO DE INTERACCIÓN (O GRÁFICO DE PERFILES) la situación 
de no interacción se asocia siempre con la presencia de líneas estrictamente paralelas (figura 3.6). 


$: 
sb 2 


Media 


> 
8 


Figura 3.6. — Gráfico de medias de la situación 1 (no interacción). 


Por el contrario, la situación de interacción se deduce cuando la diferencia entre las medias de las ca- 
sillas de una fila o columna no es igual para al menos una de las restantes filas o columnas. Por ejemplo, 
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para las medias de la situación 2, la diferencia entre las casillas a1 y 42 para b1 (8-4 = 4) no es la misma 
que la de b2 (6-6 =0) ni de b3 (4-8 = -4) y por supuesto tampoco a sus medias marginales (6-6 = 0). 
Del mismo modo las diferencias entre las casillas b1, b2 y b3 para al (8-6=2y6-—4=2) tampoco es la 
misma que la de a2 (4-6 =-—2 y 6-8 = -2) ni la de sus medias marginales (6-6=0 y 6—6= 0). El gráfico 
de la interacción correspondiente se muestra en la figura 3.7 (izquierda). Obsérvese que el cruce entre 
ambas variables es completo, lo que se advierte también por el diferente signo de las diferencias pero el 
mismo valor absoluto. El tipo de interacción que se observa en este caso se denomina INTERACCIÓN NO 
ORDINAL, porque las líneas de B para cada nivel de A se cruzan en algún punto. 

También hay interacción con las medias de la situación 3, puesto que la diferencia entre las casillas 
al y a2para b1 (7-3 = 4) no es igual que para b2 (7—5= 2) y b3 (7—7 = 0) ni para sus medias marginales 
(7—5 = 2). También la diferencia entre b1, b2 y b3 para al (7-7 =0 y 7-7 =0) es diferente para a2 
(3-5=-2y5-7=-2) y para sus medias marginales (5-6 =-—1 y 6-7 =-—1). El gráfico de interacción 
para esta situación se muestra en la figura 3.7 (derecha). Obsérvese que no existe cruce entre las líneas de 
B para cada nivel de A. Este tipo de interacción se denomina INTERACCIÓN ORDINAL, porque las líneas 
de B para cada nivel de A nunca se cruzan, y por tanto se respeta el orden: al tiene medias superiores 
(o como mucho, iguales) a a2 para todos los niveles de B. 
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Figura 3.7. — Gráficos de medias de la situación 2 (izquierda) y 3 (derecha). 


Un frecuente error que muchos investigadores cometen cuando aplican el modelo ANOVA de dos 
factores es ajustar el modelo con todos los efectos (el modelo interactivo) e interpretar después los re- 
sultados aplicando contraste de hipótesis particulares tanto para el componente de interacción como 
para los efectos principales. Este modo de actuar viola el principio de parsimonia y puede generar erro- 
res de interpretación, ya que la introducción o eliminación de componentes puede producir cambios 
importantes en las razones F, particularmente en diseños cuasiexperimentales y en general en diseños 
no equilibrados, como trataremos más adelante. Un grave error de interpretación se produce cuando 
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el efecto de interacción resulta significativo pero se obvia el efecto y se interpretan los efectos princi- 
pales. Según el PRINCIPIO DE MARGINALIDAD (Nelder, 1977), los efectos principales de dos factores son 
efectos que se asumen marginales a la interacción entre ambos factores, que ocupa un escalón jerárqui- 
camente superior. El principio especifica que un modelo que incluye una interacción significativa debe 
contener también los efectos principales, pero se trata de un modelo interactivo y por tanto solamente 
la interacción debe ser interpretada, no los efectos principales. En cambio, un modelo que incluye una 
interacción no significativa debe prescindir de la interacción y especificar un modelo aditivo, donde los 
efectos principales serán entonces objeto de interpretación. 

La interpretación de los efectos interactivos es a veces complicada. Conviene que se realice con la 
máxima precaución y siempre después de un ajuste condicional de modelos (Fox, 1997). Sólo debe in- 
terpretarse un efecto interactivo cuando se confirme que se ajusta el modelo no aditivo, en cuyo caso la 
presencia de interacción implica que los efectos de un factor no son consistentes a todos los niveles del 
otro factor. Por esta razón, en presencia de una interacción significativa (ajuste del modelo no aditivo) 
debe interpretarse sólo la interacción, obviando los efectos principales, mientras que cuando la interac- 
ción no es significativa (ajuste del modelo aditivo), deben interpretarse sólo los efectos principales. 

En presencia de interacción significativa, la mayoría de los autores recomiendan realizar un análisis 
de los EFECTOS SIMPLES, que examina los efectos de un factor para todos los niveles del otro factor. Por 
ejemplo, para un ANOVA factorial 3 x 3 (como en el ejemplo 3.3 que tratamos más adelante), siendo A 
el primer factor y B el segundo factor, hay tres efectos simples para el factor A, a saber, un efecto simple 
de A para B = b1 (SCajp1), otro efecto simple de A para B = b2 (SC apo) y otro efecto simple de A para 
B = b3 (SCajp3). Hay también tres efectos simples para el factor B, un efecto simple de B para A= al 
(SCgja1), un efecto simple de B para A= a2 (SCg¡a2)y un efecto simple de B para A= a3 (SCg¡a3). Una 
propiedad interesante es que la SC de los efectos simples de un factor para todos los niveles del otro es 
igual a la SC del factor más la SC de la interacción. Así, para el efecto simple de B, SCg¡A = SCg+SCag y 
para el efecto simple de A, SCajg = SCA + SCA. Con cada una de las sumas de cuadrados de los efectos 
simples se asocia un número de grados de libertad que depende del número de medias de factor. 


3.5.3. Ejemplo de ANOVA con dos factores fijos 


El cuadro 3.14 presenta los datos empíricos de un estudio que analiza el efecto del entrenamiento 
motivacional sobre el rendimiento (rend), empleando tres programas de entrenamiento motivacional 
(factor A, entre, con niveles al: 'instrumental”, a2: 'atribucional' y 43: 'no entrenamiento”) que se aplican 
a tres grupos de 15 escolares seleccionados al azar. Un tercio de los sujetos de cada grupo recibió el 
entrenamiento bajo uno de tres diferentes climas de clase (factor B, clima), con niveles b1:'cooperativo', 
b2: "competitivo y b3: 'individual”). El formato abreviado de presentación del cuadro 3.14 muestra los 
valores de la variable de respuesta para todas las combinaciones de tratamiento de A y B. Se trata de un 
ANOVA factorial 3 x 3 con n= 5 réplicas por combinación de tratamiento y representa el ejemplo 3.3. 


CUADRO 3.14 
Datos empíricos del ejemplo 3.3 


clima (B) 


entrenamiento (A) b1: cooperativo | b2: competitivo | b3: individual 


al: instrumental 8,7,7,6,7 4,6,5,4,6 9,7,8,8,10 
a2: atribucional 5,7,6,7,5 6,5,3,6,3 4,5,7,4,5 
a3: no entrenamiento 8,5,6,5,6 7,3,5,4,5 7,4,3,4,6 
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El análisis descriptivo de los datos del ejemplo 3.3 se muestra en la salida 3.8, con especificación de 
la media, la suma (bruta), la varianza y las réplicas para cada casilla o combinación de tratamiento. 


SALIDA 3.8 
Análisis descriptivo del ejemplo 3.3 


Variable dependiente: rend 


o 


Varianza 


3 


.500 
1.000 
1.300 


1.000 
2.300 
1.500 


1.500 
2.200 
2.700 


1 
2 
3 
1 
Z 
3 
1 
2 
3 


a a aja a aja a yl 


2.745 


Ys 
gal 


La figura 3.8 detecta la presencia de interacción. Observe que las líneas que corresponden a los nive- 
les b1 y b2 son aproximadamente paralelas, pero la del nivel b3 se desvía del patrón. Por tanto, conviene 
estimar primero el modelo no aditivo para determinar si la interacción es significativa. 


clima 
q 1 
2 
mbr 3 


Figura 3.8. — Gráfico de la interacción del modelo ANOVA ejemplo 3.3 
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Consultando la salida 3.8 y aplicando el procedimiento de cálculo que se resume en el cuadro 3.15, 
y asumiendo réplicas homogéneas (el procedimiento se aplica con algunos cambios cuando no hay 
réplicas homogéneas), es muy simple obtener primero las cantidades básicas y después las SC para los 
factores (SCa, SCg y SCag) y la SC Residual o Error (SCr) junto con sus respectivos grados de libertad. Y 
una vez obtenidas las SC y los grados de libertad de los efectos factoriales, la MC¿, MCg, MCag y MCr 
se obtienen dividiendo cada SC por sus correspondientes grados de libertad. 


CUADRO 3.15 
Descomposición de la variación y fórmulas de cálculo del modelo ANOVA de 2 factores 


Cantidades básicas Procedimiento de cálculo No términos 
101] =72/abn 2582/45=1479.200 | 1 
[A] = E 42/bn 1022/15+...+782/15=1504.800 | 3 
[B] = E B2/an 952/15+...+912/15=1499.333 | 3 
[AB] =E Y AB*/n 35%/5+...+24?%/5=1544 | 9 
[RI=(1-DES;, (M(5+..+2.7)=56 | (4)0) 
Sumas de cuadrados Procedimiento de cálculo G. libertad 
SCA=[4] - [1] 1504.8-1479.2=25.6 | gl¿=2 
SCg =[B]- [1] 1499.333 — 1479.2=20.133 | glg=2 
SCaB =[AB]-[4]-[B]+[1] | 1544- 1504.8-— 1499.333 + 1479.2= 19.067 | glyg=4 
SCr=1[R] 56 | glp=36 
SCu =[4B]- [1] 1544-1479.2=64.8 | gly=8 
SCr =[4B]+[R]- [1] 1544+56-1479.2=120.8 | glr =44 


Las razones F para probar los efectos principales y el efecto interactivo son siempre el resultado 
de dividir las MC de cada uno de los términos del modelo contra la MCr, una característica distintiva 
del modelo de efectos fijos. El modelo resultante es el modelo no aditivo o interactivo (modelo [AB]), 
que incluye el componente de interacción A x B y los efectos principales de A y B. La tabla ANOVA 
del modelo se presenta en la salida 3.9. El ajuste global relativo de este modelo es aceptable, ya que 
Fm(8,36) = 5.207; P < .001, y puesto que el componente interactivo de orden superior (A x B) es también 
significativo, F1p (4,36) = 3.064; P = .029, aplicando el principio de marginalidad de Nelder, podemos 
obviar los efectos principales e interpretar sólo la interacción. 


SALIDA 3.9 
Tabla ANOVA del modelo no aditivo (modelo [AB]) 
Variable dependiente: rend 
Fuentes SC tipo IM 
Modelo 64.800 
A (entrenamiento) 25.600 
B (clima) 20.133 


Ax B 19.067 
Residual 56.000 
Total 120.800 


No obstante, la decisión acerca del ajuste de un modelo debe descansar en última instancia en el 
ajuste condicional. Dos modelos más simples que el modelo interactivo de la salida 3.9 (Modelo 3) son 
el modelo aditivo, que incluye sólo los efectos principales (Modelo 2) y el modelo nulo, que no incluye 
ningún efecto de tratamiento (Modelo 1). Aunque la salida 3.9 apunta que el modelo no aditivo es el 
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más apropiado, en muchos otros casos es conveniente aplicar un ajuste condicional de modelos para 
determinar el modelo que ajusta mejor. La ventaja del ajuste condicional es que permite decidir con 
seguridad cuál es el modelo más apropiado. 

La salida 3.10 presenta el ajuste condicional que compara los dos modelos de mayor interés en el 
contexto del ANOVA factorial, el modelo aditivo (modelo [A,B] o modelo restringido) y el modelo no 
aditivo o interactivo (modelo [AB] o modelo aumentado). La prueba de ajuste utiliza la razón de la di- 
ferencia en suma de cuadrados y en grados de libertad entre ambos modelos (19.067/4) respecto a la 
razón entre suma de cuadrados y grados de libertad del modelo más complejo (56/36). El resultado de 
la razón es F = (19.067/4)/(56/36) = 3.064. La prueba empírica resultante es F¿g (4,36) = 3.064; P =.029, 
lo que conduce a concluir que hay diferencias significativas entre los dos modelos y por tanto no es 
posible prescindir del componente extra del modelo [AB], que es el componente de interacción A x B. 
Observe que este resultado es exactamente el mismo que refleja la salida 3.9 porque sólo incluye un tér- 
mino extra. En consecuencia, el modelo más apropiado es el modelo no aditivo o interactivo (modelo 
[AB)), que incluye la interacción entre los dos factores. 


SALIDA 3.10 
Ajuste condicional de modelos 
Modelo 2: rend= A+ B 
Modelo 3: rend= A+B+AxB 
Modelo 
2:[4,B] 


3:[4B] 


Dado que la interacción A x B es significativa, puede abordarse su interpretación analizando los 
efectos simples de un factor para todos los niveles del otro factor. Antes de iniciar el análisis, es preciso 
constatar primero que no se viola el supuesto de homocedasticidad. Para el modelo no aditivo, la prueba 
de Levene no fue significativa: F(8,36) = 0.955; P =.485. 

Los efectos simples de A son sumas de cuadrados de A para cada uno de los niveles de B, y se obtie- 
nen de la misma forma que la SC del efecto principal de A del cuadro 3.11, pero seleccionando en cada 
caso las correspondientes sumas de la salida 3.11 que afectan a un determinado nivel de B. Así, 


SCajw = (35)7/5+(30)7/5+ (30)?/5 -— (95)?/15 = 3.333 
SCam. = (5*/5+(23)7/5+ (24)7/5- (72)?/15 = 0.400 
SCaiws = (42)?/5+(25)7/5+ (24)? /5-— (91)?/15 = 40.933 


Como chequeo analítico, puede comprobarse que la suma de los efectos simples de A para los niveles 
de B es igual a la suma del efecto principal de A más el efecto interactivo A x B. En efecto, 3.333 + 0.4 + 
40.933 = 25.6+ 19.067 = 44.667 (véase salida 3.11). Los efectos simples de B para cada uno de los niveles 
de A se obtienen de la misma forma seleccionando las sumas pertinentes de la salida 3.11 que afectan a 
un nivel determinado de A, 


SCgjar = (35)%/5+ (24)%/5+ (42)?/5- (102)?/15= 29.200 
SCpiaz. = (301?/5+(23)?/5+ (25)/5-— (78)?/15 = 5.200 
SCgiasz = (3017/5+ (24)?/5+ (24)?/5- (78)? /15 = 4.800 


y también cumplen con la condición de que su suma es igual al efecto marginal de B más el efecto 
interactivo Ax B: 29.24 5.2+4.8 = 20.133 + 19.067 = 39.200. 
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La salida 3.11 muestra los resultados de un análisis de varianza con los efectos simples de A para 
cada uno de los niveles de B, que en todos los casos se etiqueta como 'Contraste'. La salida 3.12 hace lo 
propio con los efectos simples de B para cada uno de los niveles de A. 


SALIDA 3.11 
Tabla de efectos simples de A para cada nivel de B 


Variable dependiente: rend 


Efecto de A para 


b1 (cooperativo) Contraste 
Error 


b2 (competitivo) Contraste 
Error 
b3 (individual) Contraste 


Error 


SALIDA 3.12 
Tabla de efectos simples de B para cada nivel de A 


Variable dependiente: rend 


Efecto de B para 


al (instrumental) Contraste 
Error 


a2 (atribucional) Contraste 
Error 


a3 (no entrenamiento) Contraste 


Error 


Nótese que todos los efectos simples se prueban contra la MCr, que se etiqueta como 'Error' en la 
salida. Si se precisa, sus valores de probabilidad deben corregirse con el ajuste de Bonferroni. En con- 
secuencia, utilizando un valor estricto de error tipo 1 (por ejemplo «a = .01), sólo se encuentran dos 
efectos simples estadísticamente significativos, el efecto simple de A para el nivel b3 (clima individual) 
y el efecto simple de B para el nivel al (entrenamiento instrumental). Puesto que A y B tienen más de 
dos niveles, es preciso realizar comparaciones múltiples entre medias de grupo con los efectos simples 
significativos. Con esta finalidad se aplicó la prueba DHS de Tukey con ajuste de Bonferroni y se en- 
contró que, para b3 (clima individual), hay diferencias significativas entre las medias de entrenamiento 
instrumental y atribucional, al — a2 (P < .001) y entre las medias de entrenamiento instrumental y sin 
entrenamiento, al — a3 (P < .001), pero no entre a2-— 43, y para al (entrenamiento instrumental) hay 
diferencias significativas entre las medias de clima de clase cooperativo y competitivo, b1 — b2 (P < .05) 
y entre las medias de clima de clase competitivo e individual, b2— b3 (P < .001), pero no entre b1-— b3. 

Estos resultados apuntan que se produce un efecto interactivo entre tipo de entrenamiento (4) y cli- 
ma de la clase (B) para explicar el rendimiento, más allá del efecto que puedan producir A y B de forma 
individual. Este efecto sinérgico puede explicarse por la combinación del entrenamiento instrumental 
con el clima de clase individual. El análisis de efectos simples de A para cada uno de los niveles de B 
y el posterior contraste entre medias de grupo permite valorar el efecto de moderación que produce el 
clima de clase individual en la relación entre entrenamiento instrumental y rendimiento. El análisis de 
efectos simples de B para cada uno de los niveles de A y el posterior contraste entre medias de grupo 
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detecta el efecto de moderación que produce el entrenamiento instrumental en la relación entre clima 
de clase competitivo y rendimiento. 

Una prueba F significativa en un modelo ANOVA simplemente detecta la presencia de un efecto, 
pero no proporciona información alguna acerca de la importancia práctica o clínica del mismo (véa- 
se Frías, Pascual y García, 2002; Pintea, 2010; Thompson, 2002a). Tal información la proporcionan las 
medidas de magnitud del efecto, que para el ANOVA de dos factores son una simple generalización de 
las del ANOVA de un factor (véase sección 3.2.2), se definen como la proporción de la varianza total 
atribuida a un efecto y se aplican a cada uno de los efectos del modelo ANOVA de dos factores. 

Puesto que se ajusta un modelo interactivo, las medidas de magnitud del efecto basadas en 7? 
se interpretan como coeficientes de determinación para cada efecto y no requieren cumplir con el 
principio de marginalidad. Para el ejemplo que tratamos son, para A: Y = SCA/SCr = .212, para B: 
Me = SCg/SCr = .167, y para AB: 0 = SC1g/SC7 = .158. En consecuencia, todos los efectos son de 
magnitud moderada. Obviamente, para el modelo en su conjunto, la magnitud explicada por los efectos 
factoriales es la suma de todos los efectos, o sea, fu = .212+.167+.158 = .536 y por tanto casi el 54% 
de la varianza de rend está explicado por los factores A, B y su interacción A x B. Algunos autores (p. 
ej., Keppel y Wickens, 2004) manifiestan que la varianza explicada por una fuente de variación puede 
resultar afectada por la inclusión de otras fuentes en un mismo modelo y, siguiendo su recomendación, 
programas como SPSS emplean una medida alternativa de magnitud del efecto denominada ETA CUA- 
DRADO PARCIAL (%?), que se define de forma similar a las medidas de 7? pero en lugar de dividir por la 
SCr, que es la suma de todos los efectos, divide cada efecto concreto por la suma de tal efecto y la SCp, 
O sea: 


7 - SC; La gl¡xFj 
SCj+SCr  (gl¡x Fj)+ gl 


(3.35) 


donde el subíndice ¡ se refiere a un efecto concreto (4, B o Ax B), y gl, se refiere a los grados de 
libertad del denominador de la razón F. Para los datos del ejemplo 3.3, los valores de 5? son: a = 
SCA/(SCA + SCp) =.314, 7 = SCp/(SCp + SCp) = .264 y 7% = SCap/(SCag + SCp) = .254, que como 
se observa son todos valores de magnitud alta. Es importante advertir que ya no es posible calcular una 
medida conjunta para el modelo, como se calculó para 7?, porque la suma de las proporciones 7? puede 
ser mayor de uno. Esta divergencia en la interpretación de resultados ha generado mucha controversia 
y cierto desconcierto en los investigadores (Pierce, Block y Aguinis, 2004). Incluso en algunas versiones 
de SPSS se usaban medidas 5? que se trataban como si fueran medidas %? (Levine y Hullett, 2002). 

No obstante, conviene de nuevo recalcar que las medidas basadas en 1? son estimadores sesgados de 
naturaleza muestral. Un estimador menos sesgado, de naturaleza poblacional, es w? de Hays. Para cada 
uno de los componentes del modelo interactivo puede obtenerse, dependiendo de que se disponga de 
SC o de razones F, mediante: 


SC;j-—(glj)MCr Ñ gl¡(F;¡- 1D) 
SCr+MCp — Yjlgl¡x(F¡-D1+N 


0? = (3.36) 


Por ejemplo, utilizando la primera formulación para A, 0 = [SCA¿- (a-1) MCr/(SCT + MC) = 0.183, y 
utilizando la segunda para B, Or = (2) (5.47D/[(2)(7.225) + 2)(5.471) + (490.064) + N] = 0.139. 
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Sin embargo, recomendamos realizar el cálculo de w? con los componentes de la varianza utilizando 
una generalización de la ecuación 3.17. Consultando la salida 3.12, los componentes de varianza son: 


AS (a- Y (MCA-MCR)  (2(2.800- 1.556) 


NE E = 0.500 
N 45 
E b-1 - 0671. 
ón = PD(MCÍ- MC) _ (2)(10.067- 1.556) _ , ¿yy 
N 45 
z -D(b- A iia 
$0 = “=D D(MCap=MCH _ (2)(2)(4.767- 1.556) _, 9% 
N 45 
6. = 1556 


donde la estimación de la varianza total E la suma de todos los componentes, ds = 0.500 + 0.378 + 
0.285 + 1.556 = 2.719, y los coeficientes w” son las proporciones de cada componente respecto de la 
varianza total: 0 = 0.5/2.719 = 0.184, O% = 0.378/2.719 = 0.139 y Oe = 0.285/2.719 = 0.105. En con- 
secuencia, todos los coeficientes son de magnitud moderada según las etiquetas de Cohen. También se 
puede calcular un coeficiente parcial w5 dividiendo el componente de varianza para un efecto por la su- 
ma del mismo componente de varianza más la varianza de error, pero no recomendamos esta práctica. 

Finalmente, la potencia observada de las pruebas de significación del modelo ANOVA no interactivo 
puede obtenerse estimando primero el parámetro de no centralidad para cada efecto, o sea, multipli- 
cando el valor de F por sus grados de libertad. Así, para A, Aa= = (8.229) (2) = 16.5, Ap = = (6.471) (2) = 12.9 
y A AB = (3.064)(4) = 12.3. Consultando la tabla D del Anexo de tablas estadísticas para el nivel del 5%, 
los valores de potencia observada son respectivamente $4 = 0.95, Hg = 0.88 y H 18 = 0.75. Para el mo- 
delo del ejemplo 3.3, los valores de potencia observados apuntan que, con excepción del componente 
de interacción, que se queda ligeramente por debajo del criterio recomendado de 0.80, los valores de 
potencia de A y de B son óptimos. 


3.5.4. Generalización a modelos complejos 


Los modelos ANOVA con más de dos factores son una generalización de los modelos ANOVA de uno 
y dos factores tratados en secciones anteriores para incluir cualquier número de factores, pero a costa 
de incrementar notablemente su complejidad interpretativa. Mientras que el ANOVA con 2 factores (A y 
B) tiene dos efectos principales y un efecto de interacción, en el ANOVA con tres factores (4, B y C) hay 
3 efectos principales y 4 efectos de interacción, tres de los cuales son EFECTOS INTERACTIVOS DE PRIMER 
ORDEN, porque conciernen a interacciones entre dos factores cualesquiera y uno es un EFECTO INTER- 
ACTIVO DE SEGUNDO ORDEN, porque conciernen a interacciones entre tres factores. Del mismo modo, en 
el ANOVA con cuatro factores (A, B, C y D) hay 4 efectos principales, 6 efectos de interacción de primer 
orden, 4 efectos de interacción de segundo orden y un EFECTO DE INTERACCIÓN DE TERCER ORDEN que 
concierne a interacciones entre cuatro factores. El cuadro 3.16 compara los efectos de modelos ANOVA 
con 2, 3 y 4 factores. 

En general, el número de efectos para un ANOVA factorial puede obtenerse calculando las combi- 
naciones del número de factores (K) tomados de k en k, donde k es el efecto factorial deseado (k = 1 
para efecto principal, k = 2 para efectos interactivos de primer orden, k = 3 para efectos interactivos 


5 
de segundo orden, etc.). Así, un modelo ANOVA factorial con 5 factores tiene Ñ = 5 efectos principa- 


5 5 
les, (7 = 10 efectos de interacción de primer orden, ( = 10 efectos de interacción de segundo orden, 
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5 
M = 5 efectos de interacción de tercer orden y 


5 
a = 1 efecto de interacción de cuarto orden. 


CUADRO 3.16 
Efectos factoriales ANOVA con 2, 3 y 4 factores 


Efectos interactivos 
Factores | Efectos principales | Primerorden Segundo orden Tercer orden 
2 A AB 
B 
3 A AB,AC ABC 
B BC 
C 
4 A AB, AC, AD ABC, ABD, ACD ABCD 
B BC, BD BCD 
C CD 
D 


Afortunadamente, si se manejan bien los conceptos derivados del ANOVA con uno y dos factores, 
la generalización a modelos ANOVA más complejos es relativamente sencilla. La descomposición de 
la SCr7 en los dos componentes generales, SC explicada por el Modelo (SCyy) y SC no explicada por el 
modelo (SCr), es la regla fundamental que se aplica similarmente en todos los casos. La descomposición 
de la SCyr en los efectos factoriales principales e interactivos correspondientes depende en cada caso 
de la dimensión del modelo ANOVA. Los grados de libertad de cada una de las fuentes de variación, la 
composición de las medias cuadráticas y la construcción de razones F apropiadas se rigen también por 
los mismos principios que se expusieron anteriormente. 

La mayor complejidad de los modelos ANOVA con más de dos factores deriva sobre todo de la inter- 
pretación de las interacciones. A medida que aumenta la dimensión del modelo ANOVA, mayor dificul- 
tad. Para eludir tal dificultad, la interpretación suele afrontarse desde la perspectiva de la generalización. 
Una interacción entre dos factores implica que el efecto de un factor es diferente para los distintos nive- 
les del otro, es decir, no es generalizable para todos los niveles del otro factor. De la misma forma, una 
interacción entre tres variables implica que el efecto de la interacción entre dos factores es diferente 
para los distintos niveles del tercer factor. Desde este punto de vista, la ausencia de interacción es la 
justificación estadística de la generalizabilidad. 


3.5.5. Modelos ANOVA factorial con tres factores 


Sean tres factores, que llamaremos A, B y C, con ax bx c combinaciones de tratamiento, para cada 
una de los cuales se observan ny] réplicas. Suponiendo efectos fijos, el modelo completo representa un 
total de N = abcn observaciones y se formula como modelo de medias y modelo de efectos: 


Yijkl =  Mjki+ijkl (3.37) 
Yijrr = uMraj+Bp+y1+1a8B) ¡+ (ay 1 + (BN xr + (a By ¡ri + es 511 (3.38) 


donde Y;;x, es el valor observado de la variable de respuesta para la ¿-ésima réplica de la ¡kl-ésima 
combinación de tratamiento; 4jx, es la respuesta media de la ¡k!-ésima combinación de tratamiento; 
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u es la respuesta esperada global, constante para todas las combinaciones de tratamiento y todas las 
réplicas; a; = u;— y es el efecto del ¡-ésimo tratamiento correspondiente al factor A; Pz = 4 — H es el 
efecto del k-ésimo tratamiento del factor B; y; = 4¡— p es el efecto del /-ésimo tratamiento del factor C; 
(a PB) jk es el efecto de la interacción entre el ¡-ésimo nivel de A y el k-ésimo nivel de B; (ay) ¡Les el efecto 
de la interacción entre el ¡-ésimo nivel de A y el /-ésimo nivel de C; (By) x, es el efecto de la interacción 
entre el k-ésimo nivel de B y el !-ésimo nivel de C; (a-Py) ¡1 es el efecto de la interacción entre el ¡-ésimo 
nivel de A, el k-ésimo nivel de B y el !-ésimo nivel de C, y finalmente e;;x1 = Y; ¡x1— Mjri es el residuo o 
error experimental que corresponde a la ¡-esima réplica de la ¡k!-ésima combinación de tratamiento. 
Se asume también que los residuales se distribuyen normal e independientemente: e; ¡ki NID(O, a: 

El modelo de efectos fijos asume que los efectos «;, Bj y y] son constantes prefijadas por el investi- 
gador, y por tanto la generalización de los resultados no podrá extenderse más allá de los tratamientos 
empleados. En consecuencia, el modelo sólo tiene una variable aleatoria, la varianza residual o de error 
0?. Los estimadores de los parámetros de la ecuación 3.38 se estiman por mínimos cuadrados (OLS) y 
se muestran en el cuadro 3.17. Nótese que mientras que los efectos marginales para un factor son di- 
ferencias entre las medias marginales del factor y la media global (o sea, implica una diferencia entre 
dos medias), los efectos interactivos de primer orden son diferencias entre cuatro medias (la media pa- 
ra cada combinación de dos factores, menos su media marginal de fila, menos su media marginal de 
columna más la media global) y los efectos interactivos de segundo orden son diferencias entre ocho 
medias (una media para cada combinación de los tres factores, menos tres medias interactivas de pri- 
mer orden, más tres efectos marginales, menos la media global). La complicación con solamente tres 
factores es obvia y deja entrever la complejidad de modelos interactivos de orden superior. 


CUADRO 3.17 
Estimadores por mínimos cuadrados del modelo de efectos 


Parámetros Estimadores 


(ab) jk Vi Y ¡Yi d) 


(an j: ; Y ¡-Y¡+Y) 


(BNr 
(ABN jr: Aja Y ir Y ji Yi +Y¡+Yi+Y¡-Y) 


€ijkl Aira Y jr) 


Las fórmulas de cálculo para el ANOVA con tres factores, suponiendo réplicas equilibradas, siguen 
la misma lógica que la del ANOVA de dos factores (véase cuadro 3.11). A pesar de la complejidad, pue- 
de realizarse también con calculadora de escritorio. Los cálculos básicos se exponen con detalle en el 
cuadro 3.18. 

La descomposición de la SC7 en un modelo ANOVA con tres factores en los ocho componentes 
que reflejan los efectos factoriales citados es la piedra angular del ANOVA de tres factores. Asumiendo 
réplicas equilibradas, la descomposición es la siguiente: 
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LLL ia Y) = mb (YY (SCA) 
q A J 
+ pac 0 (SC) 
+ nba (SCc) 
+ A (SCag) 
J 
+ a a (SCac) 
+ na Yu - Y¡-Y¡+Y) (SCgc) 
+ ¡LEE Y i-Yy-Yu+Y¡+Yi+Y¡-Y)? (SCagc) 
+ ERE O? Y ¡k0?  (SCp) (3.39) 
E 
CUADRO 3.18 


Descomposición de la variación y fórmulas de cálculo del ANOVA de 3 factores 


Cantidades básicas Fórmulas de cálculo No términos 
Corrección media l=0 MIN 1 
Marginales de A A J=Y Al/ben a 
Marginales de B =)Y Bí/acn b 
Marginales de C == C2/abn C 
Marginales de AB AB|l=Y ABS; len ab 
Marginales de AC AC]=Y Y Ac? Ibn ac 
Marginales de BC BC]= xEBC, lan bc 
Marginales de ABC e FEYFABC? 5x1)? abc 
Residual = YY )Y(n- ns (n- D(abc) 
Sumas de cuadrados Fórmulas de cálculo G. libertad 
SCA =nbcY ¡á? AJ- [1] gl4=a-1 
SCg =nacYE ¡$4 B]|-[1] gla4=b-1 
SCc=nabE IF A]-([1] glp¿=a-1 
SCag=ncEz EPR, AB]|-[4]-[B]+[1] glag=ab-a-b+1 
SCac =MbE 2 (An; AC] [4]- [€] + [1] glac=ac-a-c+1 
SCpc=nNaY ¡Ex(By% BC]-[B]-[C] +11 glgc=bc-b=c+1 
SCapc=NEIERE JOB ABC]-[AB]-[4C]-[BC]+... | glagc = abc— ab—-ac-bc+... 
FLA] + [B]+ [€] — [1] +Fa+b+c-1 
SCR=EIEAE ¡E iYijer— Y pen? | 18 glr = N- abc 
SCm = SCA+SCB+SCcC+SCaAB ABC]-[1] gly=abc-1 
+SCac +SC pc +SCaABc 
SCr =SCm+SCR ABI+[R]- [1] glr=N-1 
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3.5.6. Ejemplo de ANOVA factorial con tres factores fijos 


Una investigación analizó el efecto conjunto de la ansiedad (factor A, a 2 niveles: a1, baja ansiedad, 
y a2, alta ansiedad), la tensión muscular medida mediante la presión sobre un dinamómetro (factor B, 
a 2 niveles: bl, alta tensión y b2, baja tensión) y la dificultad de la tarea (factor C, a dos niveles: cl, 
alta dificultad, y c2, baja dificultad) en un experimento de aprendizaje (ejemplo 3.4). Los sujetos fueron 
primero evaluados en ansiedad (4) y en función de la puntuación obtenida (por encima o por debajo de 
la mediana) recibieron después al azar las combinaciones de tratamiento B x C. El cuadro 3.19 presenta 
los datos empíricos y la salida 3.13 los promedios, las sumas, las varianzas y los tamaños muestrales 
empleados en el cálculo de las cantidades básicas. El cuadro 3.20 resume el proceso de cálculo. 


CUADRO 3.19 
Datos empíricos del ejemplo 3.4 


Factor C (dificultad) cl c2 
Factor B (tensión) b1 b1 b2 


Factor A 14, 12, 12 18, 14,16 | 14,10, 15 
A(ansiedad) 9,12,8 12, 10, 7 10,11,8 


SALIDA 3.13 
Análisis descriptivo del ejemplo 3.4 

Variable de respuesta: aprendizaje 

ansiedad tensión dificultad | Media 

al b1 cl 12.6667 
c2 16.0000 
14.3333 
cl 10.0000 
c2 13.0000 
11.5000 
cl 11.3333 
c2 14.5000 
12.9167 
cl 9.6667 
c2 9.6667 
9.6667 
cl 5.3333 
c2 9.6667 
7.5000 
cl 7.5000 
c2 9.6667 
8.5833 
cl 11.1667 
c2 12.83333 
12.0000 
cl 7.6667 
c2 11.8333 
9.5000 
cl 9.4167 
02 12.0833 
10.7500 


S 


D DD 0 O|Djuwo 


N 
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El gráfico de la interacción se presenta en la figura 3.9, donde la interacción B x C se muestra para 
los dos niveles de A. Existe interacción para el nivel a2 (alta ansiedad), pero no para al (baja ansiedad). 


aprend.mean 


Ed 


tens 


y 
aprend.mean 


tens 


Figura 3.9. — Gráfico de la interacción BC, para los dos niveles de A. 


CUADRO 3.20 


Resumen de cálculo de las fuentes de variación del modelo ANOVA con 3 factores 


Cantidades básicas Cálculo No términos 
11] =7?/abcn (258)2/24 =2773.5 1 
[4] = Y 42/bcn (1552/12) + (1032/12) = 2886.167 a=2 
[B] =Y B?/acn (1442/12) + (1142/12) =2811 b=2 
[C] -E Ci /abn (1132/12) + (1452/12) = 2816.167 c=2 
[AB] = E Y ABS, /cn (86? /6) + (692/6) + (582/6) + (452 /6) = 2924.33 ab=4 
[AC] = EX AC; /bn (682 /6) + (872 /6) + (452/6) + (582/6) =2930.333. | ac=4 
[BC] = E EBCi lan (672/6) + (772/16) + (462/6) + (68? /6) = 2859.667 | bc=4 
In (382 /3) +... + (292/3) = 2982.667 abc=8 


[ABC]=F Y ABC 
[R]= EL E(M- DSi; 


(21.333 + 4+...+ 9.333 + 2.333) = 77.333 


(n- D(abc)= 16 


Sumas de cuadrados Cálculo G. libertad 
SCA = [4 - [1 2886.167 —2773.5 = 112.667 1 
SC =[B]- [1] 2811-2773.5= 37.5 1 
SCc = [0] - [1] 2816.167 —2773.5 = 42.667 1 
SCag = 14B]- [4] - [B] + [1] 2924.333 — 2886.167 —2811 +2773.5= 0.667 1 
SCac = [AC] — [4] - [C] + [1] 2930.333 — 2886.167 — 2816.167+2773.5=1.500 | 1 
SCc =[BC]-[B]-[C] + [1] 2859.667 — 2811 -—2816.167 +2773.5 = 6.000 1 
SCasc = [ABC]-[4B]-[4C] | 2982.667 — 2859.667 — 2930.333 — 2924.333 +... 
...—[BC]+[C]+[B]+[4]-[1] | ...+2816.167 +2811 +2886.167-2773.5=8.167 | 1 
SC =[R] 77.333 16 
SCu = [ABC] - [1] 2982.667 — 2773.5 = 209.167 7 
SCr = [ABC] +[R]-— [1] 2982.667 + 77.33 —2773.5 = 286.500 23 
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La salida 3.14 muestra la tabla ANOVA para el modelo interactivo de segundo orden, es decir, el 
modelo que contiene todos los efectos factoriales del ejemplo 3.4. 


Variable dependiente: aprendizaje 


Fuentes 


SALIDA 3.14 
Tabla ANOVA del modelo interactivo de segundo orden 


SC tipo III 


0 
Es 


MC 


Modelo 

A (ansiedad) 
B (tensión) 

C (dificultad) 
AxB 


AxC 

BxC 

AxBxC 
Residual 


209.167 
112.667 
37.500 
42.667 
.667 
1.500 
6.000 
8.167 
77.333 


RR 


pun 
[e] 


29.881 
112.667 
37.500 
42.667 
.667 
1.500 
6.000 
8.167 
4.833 


Total 


286.500 


N 
(95) 


El modelo que se muestra en la salida 3.14 es el modelo factorial completo. Obviamente, éste no es 
el único modelo posible para un ANOVA factorial. Hay otros modelos alternativos a considerar por el 
investigador aplicado en este contexto. Siguiendo un orden jerárquico se distinguen los siguientes: 


En primer lugar, el modelo nulo, o modelo [1] (Yijri = + €ijx), que especifica que todas las ob- 
servaciones pueden ser representadas por la media global; 


En segundo lugar, el modelo aditivo, o modelo [4, B, C] (Yijei =p aj+ PBi+yi+ €:jk1), que incluye 
además parámetros para los efectos principales, o sea, (a— 1) parámetros para el efecto principal 
del factor A, (b— 1) parámetros para el efecto principal del factor B y (c— 1) parámetros para el 
efecto principal del factor C. 


En tercer lugar, el modelo interactivo de primer orden, o modelo [A4B, AC, BC] (Yijr = p+Qj+ 
Br +Y1+ (a B) ¡. + (ay) ¡1 + (BN xr + e ¡x1), que respecto del modelo 2 incluye además los efectos 
de interacción de primer orden, o sea, (a— 1)(b— 1) parámetros para el efecto interactivo AB, 
(a— 1)(c— 1) parámetros para el efecto interactivo AC y (b— 1)(c— 1) parámetros para el efecto 
interactivo BC. 


Y finalmente, el modelo interactivo de segundo orden, o modelo [4] (Vijxi= + aj+Br+yi+ (AB) jx+ 
(ay) ¡+ (BN x1 + (ABYV) jr + €¡jk1), que respecto del modelo 3 incluye además (a— 1)(b- 1D)(c-1) 
parámetros para el efecto interactivo de segundo orden ABC. 


Antes de proceder a interpretar los resultados, el investigador tiene que decidir qué modelo es el que 
mejor ajusta. La decisión debe fundamentarse en el ajuste condicional de modelos, mediante la cual el 
investigador compara dos modelos de la jerarquía, un modelo ampliado (que contiene un determinado 
conjunto de componentes) contra un modelo restringido (que excluye alguno o algunos de los compo- 
nentes del modelo ampliado) y decide finalmente cuál de los dos ajusta mejor. Una prueba F es la razón 
de los incrementos dividida por la SC del modelo ampliado y permite determinar si el componente (o 
componentes) excluido es estadísticamente significativo; silo es, entonces es válido el modelo amplia- 
do (es decir, no puede prescindirse del componente excluido); si no lo es, entonces es válido el modelo 
restringido (o sea, puede prescindirse del componente excluido). 
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Para un ANOVA factorial con 3 factores, el proceso de comparación de modelos se aplica en 3 etapas. 
En la primera se decide si el modelo [ABC] es mejor que el modelo [4B, AC, BC], en la segunda, si el 
modelo [4B, AC, BC] es mejor que el modelo [4, B, C] y en la tercera si el modelo [4, B, C] es mejor que 
el modelo [1]. El proceso de ajuste condicional completo se resume en la salida 3.15. Para interpretar 
correctamente esta salida, la lectura debe hacerse desde abajo hacia arriba. En primer lugar observe 
que el modelo completo de la salida 3.15 corresponde al modelo [ABC] (interactivo de segundo orden), 
con SCR[ABC] = 77.333 y glr[ABC] = 16. Este modelo difiere del modelo [AB, AC, BC] (interactivo de 
primer orden) por la inclusión del componente de interacción de segundo orden (SCAgc = 8.167). En 
consecuencia, el modelo [AB, AC, BC] debe tener un residual formado por el residual del modelo [ABC] 
más el componente interactivo de segundo orden, o sea, tendrá SCr[AB, AC, BC] = 77.333 + 8.167 = 
85.500 y g!r[AB, AC, BC] = 16+1= 17. La diferencia aparece en la última línea de la salida 3.18 y apunta 
que no hay diferencias significativas entre los dos: F(1, 16) = 1.690; P = .212, por lo que se elige el modelo 
más simple, o sea, el modelo [4B, AC, BC]. La última línea de la salida 3.15 ya puede descartarse, porque 
el modelo [4BC] no se ajusta aceptablemente. 


SALIDA 3.15 
Proceso de ajuste condicional de modelos 
Modelo [1]: rendim= 1 
Modelo [4, B,C]: rendim= A+ B+C 
Modelo [4B, AC, BC]: rendim= A+B+C+ Ax B+AxC+BxC 
Modelo [ABC]: rendim= A+ B+C+Ax*B+ Ax C+BxC+AxBx*C 
Modelo SCr ASCR 
1] 286.500 
[4, B,C] 93.667 192.833 


[AB, AC, BC] 85.500 8.167 
[ABC] 77.333 8.167 


Aplicamos a continuación la segunda etapa del proceso de ajuste condicional de modelos. El modelo 
ampliado es el modelo factorial interactivo de primer orden [AB, AC, BC], con SCr[AB, AC, BC] = 85.5 
y gIr([AB, AC, BC] = 17. El modelo restringido es el modelo de efectos principales [4, B, C], cuya SCr 
se obtiene a partir de la salida 3.15 sumando las SC (y los g/) de todos los componentes interactivos de 
primer orden. Así, SCr[A, B,C] = 85.5+6+ 1.5 + 0.667 = 93.667 y gIr[4, B,C] = 17+1+1+1=20. Para 
determinar cuál de los dos modelos es mejor se utiliza la línea que corresponde al modelo ampliado. La 
diferencia en SCg entre los dos modelos es ASCp = 8.167 y la diferencia en glp es Aglg = 3. La compa- 
ración entre el modelo interactivo de primer orden y el modelo de efectos principales permite concluir, 
con F(3,17) = 0.541;P = .661, que el modelo de efectos principales es mejor. La penúltima linea de la 
salida ya puede descartarse. 

La última etapa del proceso de ajuste condicional de modelos compara el modelo de efectos prin- 
cipales [4, B, C], como modelo ampliado, y el modelo nulo [1], que tiene SC = SCr = 286.5 y glr = 
g lr = 23, como modelo restringido. La diferencia entre los dos es la suma de los componentes extra de 
un modelo respecto de otro, aparece en la línea correspondiente al modelo ampliado y apunta que hay 
diferencias significativas entre ambos modelos: F(3,20) = 13.725; P < .001. En consecuencia, el modelo 
mejor ajustado de la jerarquía es el modelo aditivo o de efectos principales [4, B, C], cuya tabla ANOVA 
se muestra en la salida 3.16 y es en definitiva el único modelo que debe ser interpretado. El ajuste global 
es óptimo: Fy(3,20) = 13.278; P = .001, y la conclusión a destacar es que todos los efectos principales 
son estadísticamente significativos y que no hay ninguna interacción entre los factores implicados. 
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SALIDA 3.16 
Tabla ANOVA del modelo [A,B,C] 


Variable dependiente: rend 

Fuentes | SC tipo III MC 

Modelo 192.833 3 64.278 

112.667 112.667 
37.500 37.500 


42.667 42.667 
Residual 93.667 4.683 
Total 286.500 


Conviene reiterar que el ajuste de un modelo y su significación estadística no dice nada acerca de 
su significación práctica. Los valores de w? revelan un efecto de magnitud alta de la ansiedad (4) sobre 
el aprendizaje, 0 =.371, y efectos menos importantes, de magnitud moderada, de la tensión (B), con 
0% =.113 y de la dificultad (C), con 0%, =.131. Lo más importante, en este caso, es que los tres efectos ex- 
plican más del 60% de la varianza de la variable de respuesta. En muchos contextos de la investigación 
en psicología esta proporción de variación explicada podría considerarse óptima; en otros contextos, 
sin embargo, se puede cuestionar si el 40% de la variación de la variable de respuesta no explicada su- 
pone una reducción suficiente del error residual o debería ser objeto de posterior análisis para detectar 
variables omitidas que puedan reducir en mayor medida el error residual. 


3.6. MODELOS ANOVA MULTIVARIANTE (MANOVA) 


En algunos capítulos del texto utilizamos la generalización de los modelos ANOVA para más de una 
variable dependiente numérica. Cuando se analizan varias variables dependientes que tienen una mo- 
derada correlación entre sí (p.e., en el contexto de medidas repetidas), o bien forman parte de un mismo 
constructo, puede tener interés utilizar la versión multivariante del ANOVA. Los modelos que resultan 
de esta generalización son los MODELOS MANOVA. Así, un modelo MANOVA de un factor y el modelo 
MANOVA factorial tienen una estructura similar a los modelos ANOVA de un factor y ANOVA factorial, 
pero la variable de respuesta es una combinación lineal de dos o más variables numéricas. Y si el objetivo 
del ANOVA es la prueba de hipótesis nula sobre la igualdad de medias de grupo (Ho : M1 = M2 =-***= Ha), 
el objeto del MANOVA es la prueba de hipótesis nula acerca de la igualdad del vector de medias de grupo 
(Ho : M1 = M2 =-**= Ha), un vector cuya dimensión depende del número de variables dependientes. 

Antes de aplicar MANOVA, hay que examinar la correlación entre las variables dependientes. Lo 
ideal es que sea una correlación moderada (o sea, se encuentre dentro del rango aproximado de +0.40 
a +0.70), porque si la correlación es menor no tiene ninguna utilidad el análisis MANOVA, y si es ma- 
yor puede generar problemas de multicolinealidad. En tales casos, es mejor utilizar ANOVA con cada 
variable de respuesta que MANOVA. 

Es importante tener también en cuenta los supuestos en que se basa la técnica, que generalizan los 
de los modelos ANOVA (normalidad, homogeneidad de varianzas e independencia de las observacio- 
nes). Los modelos MANOVA deben cumplir los supuestos siguientes: 


— NORMALIDAD MULTIVARIANTE. Las variables dependientes se asumen distribuidas según una dis- 
tribución normal multivariante, lo que implica que cada variable dependiente por separado se 
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distribuye según una distribución normal univariante. La normalidad univariante es una condi- 
ción necesaria para la normalidad univariante. En este sentido es importante disponer de acepta- 
bles tamaños muestrales (la regla general es tener más casos por grupo que el número de variables 
dependientes). La prueba SW de Shapiro-Wilks puede utilizarse para determinar si hay normali- 
dad univariante y, en caso positivo, puede asumirse normalidad multivariante. 


— HOMOGENEIDAD DE LAS MATRICES DE COVARIANZA. En un MANOVA, las varianzas de grupo se sus- 
tituyen por matrices de covarianza (o sea, matrices que tienen varianzas en la diagonal principal 
y covarianzas fuera de la diagonal principal). La prueba más usada para probar este supuesto es la 
prueba M de igualdad de matrices de covarianza de Box. Si la prueba fuera significativa (matrices 
de covarianza no homogéneas), el investigador debe recurrir a la prueba de Levene para valorar 
el problema y transformar si cabe la/s variable/s afectadas de falta de homogeneidad, como tra- 
tamos en la sección 3.2.4, o bien recurrir a los procedimientos robustos tratados en Vallejo y Ato 
(2012). En cualquier caso, la prueba M de Box debe interpretarse con precaución, porque resulta- 
dos significativos pueden deberse también a la ausencia de normalidad multivariante y resultados 
no significativos pueden indicar un problema de falta de potencia. Por esta razón, se aconseja que 
el criterio para valorar la significación se establezca al menos en P <.01. 


— INDEPENDENCIA DE LAS OBSERVACIONES. Las observaciones no deben estar correlacionadas ni 
dentro de cada grupo ni entre grupos. Este supuesto es fundamental tanto en modelos ANOVA 
como en modelos MANOVA. 


En cualquier caso, se ha demostrado que los modelos MANOVA son robustos (o sea, no presentan 
sesgos importantes) ante violaciones moderadas de la normalidad multivariante y de la homogeneidad 
de las matrices de SC y PC, siempre que los grupos tengan tamaños muestrales iguales o muy similares. 

Como tratamos anteriormente (véase sección 3.1), los modelos ANOVA descomponen la SC7 en 
dos componentes: la SCyr y la SCp, donde SCy tiene un único componente en el caso de ANOVA de 
un factor, tres componentes en el caso de ANOVA interactivo de dos factores, siete componentes en el 
caso de ANOVA interactivo de tres factores, etc. Del mismo modo, en el caso de un factor, los modelos 
MANOVA descomponen la matriz de SC y PC total (Sr) en un componente explicado por el factor A 
(Sa) y otro componente no explicado por el factor A (Sr). Uno de los criterios estadísticos utilizado para 
probar la hipótesis de igualdad del vector de medias de grupo es la LAMBDA DE WILKs, que se define 
como la razón entre el determinante de la matriz residual de SC y PC y el determinante de la suma de 
las matrices del factor y del residual, 


S 
Es [Sp] 


= ————— (3.40) 
¡Sa +Sr] 


Además de la Lambda de Wilks, los modelos MANOVA emplean otros criterios estadísticos alternati- 
vos para valorar la hipótesis de igualdad de matrices SC y PC. Son, en concreto, los siguientes: la TRAZA 
DE PILLAI (P), la TRAZA DE HOTELLING (H) y la RAÍZ MAYOR DE ROY (R). Cada uno de ellos utiliza una 
distribución concreta y su significación debe consultarse en tablas apropiadas. Afortunadamente, los 
valores de todos estos criterios pueden también transformarse a una F exacta, cuya interpretación es 
más familiar para los investigadores. 


OEdiciones Pirámide 


Modelos ANOVA con efectos fijos 151 


Para determinar la magnitud de un efecto particular en un modelo MANOVA, Cramer y Nicewander 
(1979) propusieron un ÍNDICE MULTIVARIANTE DE MAGNITUD DEL EFECTO o de naturaleza similar a 
n?, que derivaron del criterio Lambda de Wilks y definieron como: 


0 =1-Al”, para t=mín(u, v) (3.41) 


donde t es el valor más pequeño de dos magnitudes, u o v, siendo u el número de variables dependien- 
tes y y = gl, son los grados de libertad del numerador de la razón F. Aunque es un tema todavía bajo 
debate si se deben aplicar las etiquetas de Cohen al índice multivariante de magnitud del efecto (véase 
Huberty, 2002), es común encontrarlo con las etiquetas en investigaciones de las Ciencias de la Salud. 

Ilustramos los modelos MANOVA con el ejemplo 3.5. Se trata de una investigación en la que el tema 
central era el aprendizaje de puzles en niños de escuelas infantiles. El investigador utilizó una muestra 
de 30 niños de 3 a 4 años. Como factores se emplearon el método (A, meto) usado en la solución, con 
dos niveles (41: método simple y a2: método geométrico) y el nivel de complejidad (B, ncomp) del puz- 
le, con tres niveles (puzles compuestos de bl: 25, b2: 50 y b3: 100 piezas). A cada niño se le administró 
una combinación de un método particular para solucionar un puzle de un nivel de complejidad esta- 
blecido por azar. Las variables dependientes fueron el tiempo medio invertido en la solución de cada 
puzzle (tiempo) y el número total de piezas cambiadas durante la solución (camb), que el investigador 
se interesó en analizar de forma conjunta. Los datos empíricos se muestran en el cuadro 3.21. 


CUADRO 3.21 
Datos empíricos del ejemplo 3.5 


meto | ncomp | tiempo camb | “-. tiempo tiempo 

1 1 14 19 11 

1 1 17 2 3 
1 1 19 2 3 
1 1 18 2 3 
1 1 10 18 2 3 
2 1 10 15 2 3 
2 1 9 15 2 3 
2 1 11 15 2 3 
2 1 13 13 2 3 
2 1 14 17 2 3 


Puesto que hay dos factores, el análisis debe comenzar contemplando el modelo MANOVA interac- 
tivo con los efectos de método, nivel de complejidad y su correspondiente interacción, pero puesto que 
el efecto interactivo no fue significativo, los resultados del análisis correspondiente al modelo aditivo se 
muestran en la salida 3.17, y se comentan a continuación: 


— En la primera parte de la salida 3.17 se presentan los criterios multivariantes. Los más frecuente- 
mente reportados en la literatura son la traza de Pillai (P) y la Lambda de Wilks (A). Las prue- 
bas multivariantes revelaron efectos significativos para el método de aprendizaje: Ax = 0.243, 
F1(2,25) = 38.974, P = .000, con 1% = 0.879, y para el nivel de complejidad: Ag = 0.132, F4(4,50) = 
21.918, P =.000, con Ys = 0.934. 
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— En la segunda parte de la salida se presenta el resultado de la prueba M de Box de igualdad de ma- 
trices de covarianza. La F correspondiente permite aceptar la hipótesis nula de que las matrices 
de covarianza son iguales: M = 30.392, F(15,3150.554) = 1.590, P = .068. 


— Y finalmente, la última parte de la salida es un ANOVA univariante para cada una de las variables 
dependientes del modelo MANOVA, donde se apunta que el ajuste global relativo es aceptable 
con ambas variables y que los efectos de meto y ncomp son también significativos. Aunque no se 
muestran en la salida, las comparaciones entre medias de grupo pueden emplearse también con 
cada variable dependiente por separado con el factor ncomp (puesto que tiene más de 2 niveles). 
Con el ajuste de Bonferroni, para la variable dependiente tiempo sólo se encontraron diferen- 
cias significativas entre b1-— b3, con P =.010. Con la variable dependiente camb, sin embargo, se 
encontraron diferencias significativas entre b1 — b3, con P = .010 y entre bl -— b2 y b2-— b3, con 
P<.001. 


SALIDA 3.17 
Modelo MANOVA aditivo para el ejemplo 3.5 


Criterios multivariantes (MANOVA) 


Efecto Criterio Valor F gl glo P>F 
meto (A) Traza de Pillai 0.757 38.974 2 25 .000 
Lambda de Wilks 0.243 38.974 2 25 .000 
Traza de Hotelling 3.118 38.974 2 25 .000 
Raíz mayor de Roy 3.118 38.974 2 25 .000 
ncomp (B) Traza de Pillai 0.882 10.256 4 52 .000 
Lambda de Wilks 0.132 21.918 4 50 .000 
Traza de Hotelling 6.476 38,856 4 48 .000 
Raíz mayor de Roy 6.460 83.977 2 26 .000 
Prueba M de Box 
Efecto M de Box F gl glo P>F 
Global 30.392 1.590 15 3150.554 .068 
ANOVA factorial aditivo 
Fuentes V. dependiente SC tipo II gl MC F P>F 
Modelo tiempo 933.133 3 311.044 8.832 .000 
camb 177.300 3 59.100 54.748 .000 
meto (A) tiempo 563.333 1 563.333 15.996 .000 
camb 45,633 1 45.633 42.273 .000 
compl (B) tiempo 369.800 2 184.900 5.250 .012 
camb 131.667 2 65.833 60.986 .000 
Error tiempo 915.667 26 35.218 
camb 28.067 26 1.079 
Total tiempo 1848.800 29 
camb 205.367 29 
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3.7. SUGERENCIAS DE ESTUDIO 


En cualquier texto avanzado de Estadística o de Diseño Experimental aplicado a las Ciencias Socia- 
les y del Comportamiento podrá encontrar introducciones al procedimiento ANOVA con efectos fijos. 
Especialmente apropiados son los textos de Hays (1994), Howell (2013), Judd et al. (2008), Keppel y Wic- 
kens (2004), Kirk (2013), Kutner ef al. (2005), Maxwell y Delaney (2004) y Myers et al. (2010). En español 
recomendamos por su orientación al modelado estadístico un texto del Grupo ModEst (2005) y un ma- 
nual sobre análisis de datos para diseños experimentales de Palmer (2011). 

Es también abundante la documentación sobre magnitud del efecto. Un breve pero recomendable 
documento para iniciarse en las medidas de magnitud del efecto es Valentine y Cooper (2003). Trata- 
mientos más detallados se encuentran en Ellis (2010) y Grisom y Kimm (2005). Un excelente trabajo 
sobre el uso e interpretación de las medidas de tamaño del efecto puede consultarse en Fritz, Morris y 
Richler (2012). 

Tratamientos más específicos de los modelos ANOVA pueden encontrarse en los textos de Gams, 
Meyer y Guarino (2008) y Rutherford (2001). Sobre la problemática de las comparaciones entre medias 
de grupo destacamos el texto de Bretz, Hothorn y Westfall (2011), aplicado al programa R. Finalmente, 
un tratamiento asequible del ANOVA multivariante se aborda en Tabachnik y Fidell (2013). 
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4.1. INTRODUCCIÓN 


El modelo de efectos fijos presupone que los tratamientos se seleccionan arbitrariamente por el in- 
vestigador. En el ejemplo 3.1 que tratamos en el capítulo anterior se pretendía saber si la información 
acerca de la dificultad que se proporciona antes de iniciar la solución de un problema complejo tenía 
alguna repercusión en el rendimiento. Si el investigador se interesa exclusivamente por conocer las di- 
ferencias entre los niveles de dificultad empleados, despreciando todos las demás, puede clasificar la 
dificultad en tres clases (por ejemplo, alta, media y baja dificultad), restringiendo así la población de 
tratamientos a las tres clases citadas y limitando la variación de la variable dificultad a las tres medi- 
das prefijadas, que es incluso posible que no sean precisamente las más representativas de la dificultad. 
Esta es la forma clásica en que suele presentarse el análisis de varianza. Puesto que se trata de efectos 
prefijados, se le denomina MODELO DE EFECTOS FIJOS O también MODELO l. La ventaja esencial del mo- 
delo ANOVA con esta forma de selección (arbitraria) de niveles es que el análisis se concentra en los 
promedios de grupo, como tratamos en el capítulo anterior. Sin embargo, con el modelo 1 no pueden 
generalizarse los resultados que se obtengan más allá de los tres niveles seleccionados por el investiga- 
dor y además una repetición del estudio implica necesariamente la utilización de los mismos niveles 
de dificultad (alta, media y baja, pero no niveles intermedios o extremos) definidos por el investigador 
originalmente. 

Sin embargo, el investigador puede también optar por definir una escala de dificultad, por ejemplo 
con 20 niveles, que represente adecuadamente a toda la población de niveles de dificultad que puede 
presentar la solución del problema complejo y seleccionar aleatoriamente tres valores de la escala defi- 
nida. En tal caso, se dispone de una población de niveles (o sea, no se restringen los niveles de dificultad 
posibles) y los niveles seleccionados se asumen representativos de toda la población de niveles. Esta 
forma de selección (aleatoria) de niveles es más reciente, y se denomina MODELO DE EFECTOS ALEATO- 
RIOS, MODELO DE COMPONENTES DE LA VARIANZA, O MODELO II. Su ventaja esencial es que el análisis se 
concentra en la varianza, y no en los promedios de grupo, que carecen de interés. Con el modelo II es 
posible generalizar los resultados encontrados con los niveles aleatoriamente seleccionados a toda la 
población de niveles y además una repetición del estudio implica necesariamente la selección aleatoria 
de otros tres niveles diferentes de la población. 


Cuando se combinan dos o más factores, puede ocurrir que al menos un factor sea definido con efec- 
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tos fijos (seleccionando sus niveles arbitrariamente) y al menos otro sea definido con efectos aleatorios 
(seleccionando sus niveles aleatoriamente). El modelo resultante es el MODELO DE EFECTOS MIXTOS O 
MODELO III, que comparte las propiedades del modelo 1 para un factor y del modelo II para el otro. 

A veces la decisión sobre si considerar un factor como fijo o aleatorio puede resultar ambigua, hasta 
el punto que algunos prefieren no utilizar esta distinción (p. ej., Gelman, 2005). En este texto conside- 
ramos un factor como fijo cuando el propósito del investigador sea utilizar algunos niveles concretos 
del factor, pero no está interesado en definir una escala para el factor ni en abarcar todo el rango po- 
sible de sus valores. En tal caso, el investigador suele seleccionar arbitrariamente los niveles del factor. 
Por el contrario, consideramos un factor como aleatorio cuando el objetivo sea utilizar todos los niveles 
del factor, para lo cual puede ser necesario definir implícita o explícitamente una escala de valores para 
el mismo que abarque todo el rango de valores posible. En este último caso, lo más común (pero no 
necesario) es que el investigador seleccione aleatoriamentelos niveles que desea utilizar. 


4.2. EL MODELO ANOVA DE UN FACTOR CON EFECTOS ALEATO- 
RIOS 


El modelo matemático que sustenta el modelo de efectos aleatorios es similar al del modelo de efec- 
tos fijos, pero sustituyendo el efecto fijo a; por un efecto aleatorio a;. Los efectos fijos suelen denotarse 
con letras griegas (a, 6, etc.), mientras que para los efectos aleatorios es común utilizar letras latinas (a, 
b, etc.). La representación matemática del modelo II es 


Y¡¡=H+aj+€jj¡ (4.1) 


Mientras que en el modelo 1 los efectos de tratamiento a; son constantes prefijadas, en el modelo II 
los efectos de tratamiento a; y los efectos residuales e,; son variables aleatorias que se asumen NID 
(Normal e Independientemente Distribuidas). La esperanza matemática y varianza de las observaciones 
Y;¡ (suponiendo e; independiente de a;) es 


E(Yij) = El(p+aj+e¡j)=p (4.2) 
VIV) = Víu+a¡+e¡,)=V(aj) + V(e;¡) =0%+0% (4.3) 


y la covarianza entre observaciones Y;; e Y; j del mismo nivel de tratamiento (intraclase) es 


C(Yij Yi j) =C(u+ aj+ejj, + aj+ej 5) = C(a;, aj) = V(aj) = o (4.4) 


mientras que la covarianza entre observaciones Y;; e Y; de diferente nivel de tratamiento se asume 
igual a cero. Con las ecuaciones 4.3 y 4.4 se define el coeficiente de CORRELACIÓN INTRACLASE 7, que es 
la correlación entre las observaciones del mismo nivel de tratamiento y se formula como 


CMA Y)Y a 
PE E) otra 


(4.5) 
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En consecuencia, en contraste con el modelo 1, que tiene sólo una variable aleatoria (e;;-— NID(O, es 
el modelo II tiene dos variables aleatorias (e;; = NID(O, a?) y a; - NID(O0, a). Las varianzas o? y 0? se 
denominan en este contexto COMPONENTES DE LA VARIANZA, porque son el resultado en que se descom- 
pone la varianza de las observaciones V (Y; 2) de la ecuación 4.3. Por esta razón, el modelo II se conoce 
también como MODELO DE COMPONENTES DE LA VARIANZA. 


4.2.1. Diferencias entre el modelo I y el modelo II 


Aunque el modelo matemático tiene una forma similar, la teoría subyacente es muy diferente. Hay 
tres aspectos a destacar para comprender las diferencias entre el modelo 1 y el modelo II. 


— Una diferencia crucial entre ambos modelos es que las observaciones Y;;, que se asumen inde- 


pendientes en el modelo 1, no lo son en el modelo II. En general, las observaciones que contienen 
el mismo efecto aleatorio (o sea, pertenecen al mismo nivel de tratamiento) se suponen correla- 
cionadas. La correlación intraclase es esencialmente una medida del grado en que las observa- 
ciones dentro de un tratamiento son dependientes respecto de observaciones de diferentes trata- 
mientos. La estructura de la dependencia puede también formularse en términos de una MATRIZ 
DE COVARIANZA 2, de orden N x N (es decir, con tantas filas/columnas como observaciones), for- 
mada por a bloques diagonales de orden nx n (es decir, con tantas filas/ columnas como réplicas), 
donde los elementos de la diagonal principal son varianzas y los que están fuera de la diagonal 
principal son covarianzas. Así, para el caso de un factor con 3 niveles seleccionados al azar de 
una población, cada uno de los a bloques diagonales de la matriz de covarianza se representaría 
mediante la matriz 3 x 3: 


Dip 2 2 2 
ds a 2 E Duda 2 a 
2= Ya de da oa ' =0++07 pr 1 pr (4.6) 
Ta Ga C¿+O0g pr pr 1 


de donde puede deducirse que la varianza entre observaciones se debe a efectos de tratamiento y 
error residual (la diagonal principal de la matriz), ambos de carácter aleatorio, pero la covarianza 
entre observaciones se debe sólo a efectos de tratamiento (triángulos superior e inferior de la 
matriz). De esta definición se infiere que la correlación intraclase p, es también una medida de 
magnitud del efecto, puesto que representa la proporción de la varianza total de la variable de 
respuesta que se atribuye a los tratamientos. 


Otra diferencia entre los modelos 1 y II concierne a las esperanzas de las medias cuadráticas, que 
suponiendo réplicas equilibradas son las siguientes: 


E(MCm) SP ON (4.7) 


HI 
Q 


E(MC») S (4.8) 


!l 
Q 
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donde a? = (0 j a/a representa la auténtica varianza de los efectos de tratamiento en el mo- 


delo II (ya que se divide por a) mientras que, en el modelo I, 0, = 2 (a — 1) representa una 
(cuasi)varianza (ya que se divide por a— 1). 


— Una característica distintiva final entre los dos modelos es que mientras los parámetros del mo- 
delo I suelen estimarse por mínimos cuadrados ordinarios (OLS), los parámetros del modelo Il, 
excepto en casos muy simples, no se estiman apropiadamente por OL£S y requieren en su lugar 
estimación por máxima verosimilitud (ML), lo que complica notablemente el cálculo de los pa- 
rámetros, ya que ML requiere un proceso de cálculo iterativo que no es viable con simples cal- 
culadoras de escritorio. La estimación de los parámetros de modelos con efectos aleatorios con 
OLS se realiza con el ENFOQUE CLÁSICO y produce una tabla ANOVA convencional. La estimación 
con ML suele realizarse con el ENFOQUE MIXTO, y produce una salida diferente a la familiar tabla 
ANOVA, como trataremos más adelante. 


4.2.2. Inferencia estadística con el modelo II 


La inferencia clásica formula para el modelo II como hipótesis nula Hp : 0? = 0. Nótese que ésta ya 
no es una hipótesis sobre medias, sino sobre varianzas. Al tratarse de un efecto aleatorio, los niveles del 
factor seleccionados por azar difieren en diferentes repeticiones del experimento por lo que las medias 
de grupo carecen de interés. A diferencia del modelo l, donde el interés se centra en hipótesis sobre 
medias de tratamiento ¡ ¡, en el modelo II se concentra en las varianzas 0? de modo que: 


— Si se cumple la hipótesis nula, 0% = 0, la razón entre las esperanzas de ambas medias cuadráti- 
cas, aplicando las ecuaciones 4.7 y 4.8 será E([MCy)/E(MCp) = ala? = 1 y la variación de las 
observaciones solamente puede deberse a error aleatorio. 


— En cambio, si no se cumple la hipótesis nula, 0? 4 0 y la razón entre las esperanzas de ambas 
medias cuadráticas será E([MCm)/E(MCp) =1+ (no4 107). De la magnitud del término (na? la?) 
dependerá el rechazo de la hipótesis nula. 


Suponiendo réplicas equilibradas, los componentes de la varianza 0? y 0? pueden estimarse a partir 
de las medias cuadráticas mediante las fórmulas siguientes: 


a(MC1- MC 
N 
0% = MC (4.10) 
y la correlación intraclase mediante 
7 ó% _MCm-MCr _ Fa-1 añ 
pa ó2+06% MCy+(n-1)MCg Fa+(n-1) ; 


Como ilustración del modelo ANOVA de un factor con efectos aleatorios utilizamos de nuevo los 
datos del ejemplo 3.1 tratado en el capítulo anterior. Supongamos ahora que el grado de dificultad se 
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midiera en una escala de 1 a 20 puntos (en lugar de adoptar tres niveles prefijados, como sucedía en el 
modelo de efectos fijos) y que la información que el investigador ofrece al estudiante corresponde a tres 
valores elegidos al azar de esta escala, uno para cada nivel del factor dificultad. Supongamos también 
que los resultados obtenidos fueran los mismos que se presentaron en el cuadro 3.3 y en el análisis 
descriptivo del cuadro 3.4. Una tabla ANOVA convencional mediante el enfoque clásico con SPSS para 
este caso se representa en la salida 4.1. 


SALIDA 4.1 
Análisis de varianza del modelo 
Variable dependiente: rend 
Fuentes | SC tipo III 
Modelo 19.083 


A (dif) 19.083 
Residual 33.875 
Total 52.958 
4 MCR 


Nótese la similaridad en el formato de salida del ANOVA para el modelo II (salida 4.1) respecto del 
modelo I (salida 3.6). La única diferencia relevante es una indicación mediante un superíndice sobre la 
F del factor (y del Modelo). La información que transmite tal indicación, representada a pie de tabla, es 
que la razón F para el factor dif ha tomado como media cuadrática para el denominador MC (recuér- 
dese que MC es siempre el denominador de todas las razones F en el modelo de efectos fijos). Cuando 
solamente hay un factor, la tabla ANOVA es igual (con excepción de la llamada a pié de tabla), y por tanto 
se interpreta de forma similar en ambos modelos, pero cuando hay más de un factor la tabla ANOVA no 
se interpreta de la misma forma, ya que la hipótesis que se prueba es una hipótesis sobre varianzas y 
no sobre medias de grupo y es necesario tener en cuenta las esperanzas de las medias cuadráticas, co- 
mo tratamos en detalle más adelante, en este mismo capítulo. Y aunque puede utilizarse una prueba F 
convencional para probar la hipótesis de que los efectos factoriales son cero, todo el interés del modelo 
reside en los componentes de la varianza, la estimación de la varianza para el factor y la estimación de 
la varianza para el Error residual. Aplicando las ecuaciones 4.9, 4.10 y 4.11 se obtienen las estimaciones 
de los componentes de la varianza y de la correlación intraclase para los datos del ejemplo 4.1, con: 


3)(9.542-— 1.613 

OS 00 
24 

= MCr=1.613 


o 
AN an 


> 


donde la estimación de la varianza total es o. = 62 +6? = 2.604, y la correlación intraclase resulta: 


RA = 61 = .991/2.604 = 0.381. En consecuencia, el 38.1% de la varianza de las observaciones se atribuye 
a varianza debida a los tratamientos y el restante 61.9% es varianza residual. 

Si sólo se dispone de la razón F (p. ej., se tiene acceso a los resultados publicados en un informe de 
investigación), la fórmula para estimar pe es una adaptación de la ecuación general 3.15 para factores 
aleatorios: 


a (AED 
A= 


(D(EFA-D+N (4.12) 


0 
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donde a es el número de niveles del factor aleatorio y N el tamaño muestral. Para los datos del ejem- 
plo 3.1 que repetimos aquí con A como efecto aleatorio, aplicando la ecuación 4.12 se obtiene pe = 
[(8)(4.915)1/[(86) (4.915) +24] = 0.381. Cuando el efecto es fijo, la proporción de varianza explicada es algo 
menor: 0 = 0.291. 

La estimación de la potencia observada de un efecto aleatorio es más simple que en el modelo de 
efectos fijos porque no se precisa la distribución F no central. En realidad se distribuye como un múl- 
tiplo (1 + 14) de la distribución F central, donde q es el índice de potencia (véase ecuación 3.19 del 
capítulo 3). En el modelo de efectos aleatorios f = 02/07. Si se conoce la razón Fa, al nivel de significa- 
ción del 5% la potencia de la prueba Hp : 0? =0 puede obtenerse directamente mediante: 


a5sFgl, gl 
p(r> tez) (4.13) 


1+nQ 


Algunos paquetes estadísticos disponen de funciones apropiadas para calcular los valores de poten- 
cia observada a partir de la ecuación 4.13. Por ejemplo, siendo Fc el valor crítico y Fe el valor empírico 
de F, con el paquete R la estimación de la potencia observada del efecto de A para el ejemplo 4.1 se 
obtiene ejecutando los siguientes comandos y obtiene P = 0.565: 


>Fc = qf(0.95,2,21) 


>Fe = 5.915 
>1 - pf(Fc/Fe,2,21) 
>0.565 


A efectos prácticos la estimación de la potencia observada puede consultarse en la tabla G (a = .05) 
y la tabla H (a = .01) del anexo de tablas al final del texto. Para ello, dados unos grados de libertad para 
numerador y denominador de la razón F de un efecto (que se asume conocida), la tabla 1 presenta los 
valores críticos F, al nivel del 5% en la tercera columna y las siguientes columnas son posibles valores de 
la razón F del efecto (usualmente reportada en el informe de investigación). La intersección de ambos 
argumentos es el valor de potencia de la prueba correspondiente. En el ejemplo 4.1, para aproximar la 
potencia de la prueba del efecto de A, con 2 y 21 grados de libertad, y con a = .05, la tabla G solamente 
aporta información para 20 grados de libertad, y para un valor del efecto de Fx = 6 (lo más cercano al 
valor reportado de F4 = 5.915). En este caso, el valor de potencia es P4 = .568. Este valor puede ser objeto 
de interpolación lineal; una vez interpolado, puede concluirse que Pa =.565. 

Conviene advertir que el programa SPSS no distingue efectos fijos y aleatorios para calcular la po- 
tencia observada. De hecho, asumiendo efectos aleatorios para A, el programa reporta un valor de po- 
tencia observada de 0.824, el mismo que se obtuvo asumiendo efectos fijos para A (véase Sección 3.2). 

La salida 4.1, realizada con el enfoque clásico, es una representación subsidiaria del modelo de efec- 
tos fijos, que no resulta en general conveniente con modelos ANOVA factoriales y puede incluso en 
ocasiones conducir a errores interpretativos. La salida 4.2 es una representación alternativa de los re- 
sultados, menos convencional, pero más informativa, que resume de forma compacta los resultados 
de la aplicación del enfoque mixto a los modelos II y !II con los paquetes estadísticos más populares 
(GENSTAT, SAS, SPSS, STATA y R). Observe que se distinguen tres partes de la salida, representando en 
la primera parte la estructura de covarianza y los criterios de información, en la segunda parte los esti- 
madores de los efectos aleatorios y en la tercera parte una tabla ANOVA con los efectos fijos del modelo. 
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SALIDA 4.2 
ANOVA de un factor (modelo 11) con el enfoque mixto 

Estructura de covarianza Loglik (LL) | Desvianza (q) AIC BIC 

Componentes de la varianza 41.501 83.002 (3) 87.002 89.273 
Efectos aleatorios 

Parámetros Estimador E. típico Z de Wald | P> x? 

Varianza a 0.991 1.194 0.830 407 

Varianza a 1.613 0.498 3.240 .001 

Efectos fijos 

Fuentes de variación gl glo F P>F 

Constante 1 2 70.432 .014 


Respecto a los criterios de información, las cantidades básicas son el logaritmo de la verosimilitud 
(LL, Loglik) y la desvianza, que con estimación por máxima verosimilitud restringida se denomina tam- 
bién *—2l0g de la verosimilitud restringida' y es igual a —2LL). El criterio de Akaike (A1C) y el criterio 
bayesiano de Schwarz (BIC) son criterios estadísticos, que son funciones del logaritmo de la verosimili- 
tud LL, y sirven para valorar de forma aproximada el ajuste de un modelo en relación con otros modelos 
alternativos.! Dados dos modelos, se considera mejor ajustado el modelo que tenga más pequeños los 
valores de los criterios A/C y BIC. Los parámetros de covarianza son el objeto fundamental del análisis, 
que no aporta la salida 4.1 (aunque pueden calcularse con facilidad mediante las ecuaciones 4.9 y 4.10), 
pero sí la salida 4.2. Y finalmente, la tabla ANOVA para los efectos fijos distingue los grados de libertad 
del numerador (g/¡) y del denominador (gl>) de la razón F. En el modelo con un efecto aleatorio que 
corresponde al ejemplo 4.1, el único efecto fijo es la constante, que en la mayoría de los casos carece de 
interés sustantivo. 


4.3. ANOVA DE DOS FACTORES CON MODELOS !l y HI 


4.3.1. Introducción 


El desarrollo del ANOVA factorial con los modelos II (efectos aleatorios) y III (efectos mixtos) es 
también similar al modelo I (efectos fijos) en lo que concierne a la descomposición de las sumas de 
cuadrados, grados de libertad y medias cuadráticas. Sin embargo, difieren en la teoría de la distribución 
subyacente, y como consecuencia las razones F construidas para probar hipótesis acerca de efectos 
factoriales concretos son también diferentes. 

Un resumen comparativo de las diferencias entre los tres modelos para el caso de dos factores se 
muestra en el cuadro 4.1. Nótese que, en comparación con el modelo 1, que tiene 4 constantes (Uu, 4;, 
Biy ab ¡k) y una variable aleatoria (a?), el modelo Il tiene 4 variables aleatorias (o?, o?, 0% y 07.) y 
una constante (11), y el modelo III puede tener 2 (MODELO RESTRICTIVO) Ó 3 (MODELO NO RESTRICTIVO) 
dependiendo de si la interacción AB se considera un efecto fijo o aleatorio. Así, para un modelo mixto 
con A fijo y B aleatorio (tercera línea del cuadro 4.1), hay 2 variables aleatorias en el modelo TIT restrictivo 
(o? y 05) y 3 en el modelo TIT no restrictivo (o?, o y oh 


IMás detalles acerca del comportamiento de estos criterios se describen en Vallejo, Ato y Valdés, 2008 y Vallejo, Fernández, 
Livacic-Rojas y Tuero-Herrero, 2011a. 
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CUADRO 4.1 
Comparación de los modelos I, II y II ANOVA con 2 factores 


Factor Factor Interacción AB 
Efectos A B No restrictivo | Restrictivo Residual 

Fijos constante | constante constante aleatorio 

(modelo ID) Za;=0 26P;=0 206); =0 a 


Aleatorios aleatorio aleatorio aleatorio aleatorio 


(modelo II) a? o A b a 


Mixto (modelo IID | constante aleatorio aleatorio constante para B | aleatorio 


A fijo, B aleatorio 2a;=0 De 2 (ab); =0 a 


Mixto (modelo III) aleatorio constante aleatorio constante paraA | aleatorio 
A aleatorio, B fijo a? 2Pj=0 ap 2X(a6)jx=0 a 


La cuestión fundamental que se plantea entonces es la obtención de los valores esperados para las 
medias cuadráticas que se utilizan para calcular una razón F y estimar los componentes de la varianza. 
Utilizando 4 y KB para denotar respectivamente la población de niveles de tratamiento de los factores A 
y B, en el modelo de efectos fijos, los a niveles de tratamiento seleccionados de forma arbitraria para el 
factor A y los b niveles para el factor B representan en la práctica toda la población de tratamientos (el 
investigador desprecia de hecho todos los demás) y por tanto para el factor A, (4 — a)/4 = 0, y para el 
factor B, (B—b)/B = 0. Sin embargo, en el modelo de efectos aleatorios, los a y b niveles de tratamiento 
seleccionados de forma aleatoria de las poblaciones 4 y KW constituyen una muestra aleatoria finita de 
tales poblaciones, que se presumen constituidas por un número infinito de niveles de tratamiento, y por 
tanto para el factor A, (4 -— a)/4 = 1, y para el factor B, (B-b)/B = 1. 


4.3.2. Modelo ANOVA con efectos aleatorios 


El modelo ANOVA con dos factores aleatorios se formula mediante 


Yijk = Hjk ij 
Yiik = p+ aj + bj +(ab) ¡zx + ej (4.14) 


donde aj y bz son efectos de tratamiento que representan efectos aleatorios y (ab) ¡x es el efecto de 
interacción, que se asume también aleatorio, como resultado de combinar dos factores aleatorios. La 
literatura estadística suele distinguir la representación de los diferentes efectos. Mientras que para re- 
presentar efectos fijos se emplean letras griegas (así, los efectos a;, Pz, etc., se asumen fijos), para re- 
presentar efectos aleatorios se emplean letras latinas (así, los efectos a;, by, etc., se asumen aleatorios). 

Esto supuesto, llamando MC, MCg, MCag y MC respectivamente a las medias cuadráticas co- 
rrespondientes a los factores A y B, a la interacción AB y al término residual o de error, las esperanzas 
de las medias cuadráticas de un ANOVA factorial con dos factores aleatorios tienen la siguiente repre- 
sentación general: 
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EMCA = 0%+ En no”, +nbo=0%+ no, +nbo? 
-a 
E(MCBp) = oa” + Ez no, + nao”, = oa” + OL + nao”, 
E(MCag) = 0%+n0, (4.15) 
E(MCpY) = 0% 


Como se muestra en el cuadro 4.1, esimportante notar la existencia de cuatro componentes distintos 
de varianza en esta representación, a saber: 


La varianza de error residual, o?, que es común a todas las medias cuadráticas. Esta estimación de 
la varianza es pura, es decir, representa solamente la variación entre las unidades experimentales, 
pero no la variación debida a medias de tratamiento. 


La varianza del efecto factorial de A, 0?, que es específica de tal efecto. Recuérdese que, cuando 
se trata de un factor de efectos fijos, al dividir la suma de los cuadrados por un valor prefijado 
de niveles no se obtiene en realidad una varianza, sino una cuasivarianza que se formula como 
es = 2 0%/(a -1) = jj - w?/(a — 1). Sin embargo, cuando se trata de un factor de efectos 


aleatorios, se obtiene una auténtica varianza de los efectos de tratamiento, 0?. 


La varianza del efecto factorial de B, d% que es también específica de tal efecto. Del mismo modo, 


cuando se trata de un factor de efectos fijos, la cuasivarianza es 9; =Yk Bi -1) = Y r(Ux — 


Mia /(b—1). Pero al tratarse de un factor de efectos aleatorios, se obtiene una auténtica varianza de 
los efectos de tratamiento, Te 

La varianza del efecto de interacción, aa que es específica del efecto conjunto de los dos factores. 
Recuérdese que cuando A y B son factores de efectos fijos, la cuasivarianza resultante se formula 
como es = EjEx(apri,/(a— D(W-1= jr (jr Hj —u+pm?/(a- 1)(b— 1). Pero al ser ambos 
factores aleatorios, se obtiene una auténtica varianza, a y 


4.3.3. Modelo ANOVA con efectos mixtos 


Suponiendo A fijo y B aleatorio, el modelo de efectos mixtos se formula mediante 


Yijk 
Yijk 


Hjk + Cijk 


p4+Oaj+ by +(aD) ¡+ Ci jk (4.16) 


donde q ¡Tepresentan efectos fijos de tratamiento, bz son efectos aleatorios de tratamiento, y (ab) ¡k es 
el efecto de la interacción. Hay dos formas alternativas de considerar el efecto de interacción al combi- 
nar un factor fijo y otro aleatorio. La primera forma aplica como regla que al combinar un efecto fijo y un 
efecto aleatorio, el componente de interacción resultante es aleatorio. Este es el caso del denominado 
modelo III no restrictivo. La segunda forma se aplica desde la anterior y puede adoptar cualquiera de los 
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dos efectos, aleatorio o fijo, dependiendo de la fuente desde donde se evalúa el efecto interactivo (mo- 
delo III restrictivo): si se evalúa desde A, que es fijo, el complemento B es aleatorio y el efecto interactivo 
se considera aleatorio; si por el contrario se evalúa desde B, que es aleatorio, el complemento A es fijo y 
el efecto interactivo se considera entonces fijo. 

Hay un enconado debate en la literatura estadística en lo concerniente a las dos formas de definir el 
modelo III, ya que en el contexto académico se utiliza por lo general el modelo restrictivo, mientras que 
en el contexto aplicado suele emplearse el modelo no restrictivo (algunos detalles de la historia de este 
debate se describen en Ato, Vallejo y Palmer, 2013a). En cualquier caso, las esperanzas de las medias 
cuadráticas con A fijo y B aleatorio tienen una representación diferente dependiendo de qué tipo de 
modelo III (restrictivo o no restrictivo) se utilice. En el cuadro 4.2 se muestran las diferencias. 


CUADRO 4.2 
E(MO) para el modelo mixto no restrictivo y restrictivo (A fijo, B aleatorio) 


Modelo II no restrictivo | Modelo III restrictivo 
oc+no?, +nb0? 2 
104 


ab 


En el modelo III cabe destacar la existencia de tres componentes distintos de varianza, a saber: 


— La varianza de error residual (07), que es una variación pura de las unidades experimentales. 


— La varianza del efecto factorial de B (07), que es específica de tal efecto. 


— La varianza/cuasivarianza del efecto de interacción (07 p), que es específica del efecto conjunto de 
los dos factores y puede considerarse fija o aleatoria, dependiendo del modelo utilizado. 


La diferencia entre los dos tipos de modelos mixtos, restrictivo y no restrictivo, reside en la conside- 
ración del componente de interacción AB. Si se asume el modelo no restrictivo se considera aleatorio 
este término, mientras que si se asume el modelo restrictivo solamente se considera aleatorio desde la 
perspectiva de A, pero no de B. Pero en ambos casos se representa como una varianza. 

Similarmente, suponiendo A aleatorio y B fijo, el modelo III de efectos mixtos es 


Yijk = Hjk + ij 
p+aj+ Br +lab) jr + Cir (4.17) 


Yijk 


y las esperanzas de las medias cuadráticas tienen la siguiente representación para los dos tipos de mo- 
delos mixtos que hemos distinguido (cuadro 4.3): 


CUADRO 4.3 
E(MO) para el modelo mixto no restrictivo y restrictivo (A aleatorio, B fijo) 


Modelo II no restrictivo | Modelo III restrictivo 


2 2 2 2 2 
T¿+NO eg +nboz o + nba; 


2 2 


o7+ nos, +nas; 07+ nos, + nas; 


2 2 2 2 
T¿+NO Lg o¿+no% 


y 


0% 0% 


OEdiciones Pirámide 


Modelos ANOVA con efectos aleatorios y mixtos 165 


Nótese que las E(MC) del modelo no restrictivo no cambian ya sea A (o B) fijo o aleatorio, pero las del 
modelo restrictivo dependen de la naturaleza, fija o aleatoria, de los factores bajo consideración. 


4.3.4. Valor esperado de las medias cuadráticas 


Como consecuencia, el VALOR ESPERADO DE LAS MEDIAS CUADRÁTICAS para los modelos ANOVA de 
dos factores dependerá del tipo de modelo de que se trate: o todos los efectos fijos (modelo D), o todos los 
efectos aleatorios (modelo ID) o un efecto fijo y el otro aleatorio (modelo II). Tomando como ilustración 
A como factor fijo y B como factor aleatorio, el cuadro 4.4 resume los valores esperados de las medias 
cuadráticas en los tres tipos de modelos ANOVA. Más adelante en este mismo capítulo presentamos un 
algoritmo para resolver los valores esperados en cualquier modelo. 


CUADRO 4.4 
Esperanzas de las MC con modelos ANOVA de dos factores 


Modelo I Modelo II Modelo III (A fijo y B aleatorio) 


A y Bfijos Ay B aleatorios No restrictivo Restrictivo 


+nbo? | 0%+ no?, +nb02 +nb0? 


2 2 2 2 
O¿+Nb07 | O¿+NO%, 


2 2 2 Z 2 Z 2 
o7+ nad O¿+NO7, +NADZ | OG+NO7, +Nad 


2 
b 


El cuadro 4.4 facilita la comprensión y la definición de razones F apropiadas para probar hipótesis 
acerca de los efectos de tratamiento y de los componentes de la varianza. Una RAZÓN F prueba una 
hipótesis concreta sobre un efecto factorial. La regla general es que la media cuadrática correspondiente 
al efecto que se prueba debe ocupar el numerador de la razón F, mientras que para el denominador 
debe utilizarse una media cuadrática que corresponda a un componente del modelo cuya esperanza 
contenga todos los términos del numerador con excepción del efecto que se somete a prueba. 

Para ilustrar esta idea, sea un modelo de efectos fijos con el que el investigador desea probar el efec- 
to del factor B mediante una razón F. La media cuadrática que se coloca en el numerador de la razón 
F es necesariamente MCg (porque solamente este componente contiene el efecto de tratamiento que 
se desea probar), cuyo valor esperado es o? + nab; (véase cuadro 4.4, Modelo I). El término específico 
que se somete a prueba es la cuasivarianza 0%. La hipótesis nula Ap : 9; = 0 permite decidir si este tér- 
mino es significativamente diferente de cero. Para el denominador debe elegirse una media cuadrática 
cuya esperanza contenga solamente el término que no es específico, es decir, el término a?. Es obvio 
que la media cuadrática apropiada es MCr, cuyo valor esperado es 02. Lo mismo se aplica a los restan- 
tes efectos factoriales, donde se comprueba que la MCr es siempre el componente que se utiliza en el 
denominador de todas las razones F, como se muestra en el cuadro 4.5. 

Sea ahora un modelo de efectos aleatorios con el que se desea probar también el efecto del factor B. 
La media cuadrática que se coloca en el numerador de la razón F es nuevamente MC, cuya esperanza 
matemática es o? + no? ul nao, (véase cuadro 4.4, Modelo ID), y el término específico que se somete a 
prueba es obviamente 0%. La hipótesis nula Ho : ge = 0 permite decidir si este término es igual a cero. 


Eliminando el componente que se prueba, el componente a utilizar en el denominador debe incluir 02+ 
no? p- Consultando el cuadro 4.4 puede deducirse que el término que se precisa para el denominador 
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es MCap, cuya esperanza matemática es precisamente 0? + no? y: Por tanto, para probar el efecto de B 
con el modelo II se emplea Fg = MCg/MCAapg. De la misma forma se procede con los restantes efectos 
factoriales (véase cuadro 4.5). 

Sea ahora un modelo de efectos mixtos. En este caso hay dos formas de definir las razones F, porque 
hay dos formas de desarrollar las esperanzas de las medias cuadráticas, dependiendo de que se trate de 
un modelo restrictivo o no restrictivo. Si se emplea el modelo no restrictivo, las esperanzas son exacta- 
mente iguales a las del modelo II. Si se emplea el modelo restrictivo, en cambio, la prueba de A y de AB 
es la misma, pero la prueba de B no. El cuadro 4.5 resume la composición de las medias cuadráticas para 
construir razones F apropiadas para cada uno de los efectos factoriales del modelo II que se expusieron 
en el cuadro 4.4. 


CUADRO 4.5 


Razones F apropiadas para varios modelos ANOVA de dos factores 
Modelo I Modelo II Modelo III (A fijo y B aleatorio) 
E(MC) A y B fijos Ay B aleatorios | No restrictivo | Restrictivo 
E(MCa) MCA/MCp MCA/MCap MCA/MCab MCA/MCag 


E(MCp) MCg/MCr MC/MCAB MC /MCAB MCg/MCr 
E(MCaB) | MC1pB/MCr MCaAñB!/MCr MCaAB!/MCr MCAB!/MCr 


4.3.5. Un ejemplo de ANOVA con efectos aleatorios 


El ejemplo 4.2 (tomado de Hays, 1988, p.496) corresponde a una investigación sobre la administra- 
ción de una prueba proyectiva para probar la existencia de efectos del orden de presentación (factor A) 
y del grado de experiencia en la administración de la prueba (factor B). El investigador seleccionó al azar 
a cuatro psicólogos cualificados (expertos) a los que entrenó en la administración estandarizada del test. 
También seleccionó al azar el orden de presentación (orden) de las 25 tareas que incluía la prueba. Cada 
experto administró todos los órdenes a dos adultos voluntarios. La variable de respuesta fue el número 
total de respuestas válidas. Los datos empíricos se muestran en el cuadro 4.6 utilizando el mismo for- 
mato abreviado de ejemplos anteriores. Nótese la existencia de dos réplicas por cada combinación de 
orden por experto. 

En este caso se combinan dos factores con efectos aleatorios, porque sus niveles se seleccionan al 
azar de una supuesta población de niveles. Se asume que el investigador controla todos los posibles 
órdenes de presentación de la prueba, que constituyen una población potencial de órdenes de presen- 
tación, y que ha seleccionado al azar cuatro de esos posibles órdenes. Del mismo modo, se asume una 
población de expertos cualificados para administrar la prueba, de donde el investigador ha seleccionado 
al azar a cuatro expertos. El correspondiente análisis descriptivo se muestra en la salida 4.3. 


CUADRO 4.6 
Datos empíricos del ejemplo 4.2 


Expertos 
b2 b3 
30 33 | 25 
25 33 | 27 
26 32 | 30 
37 42 | 37 
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SALIDA 4.3 

Análisis descriptivo ejemplo 4.2 

A(orden)  B (Experto) | Media 
al b1 25.5000 
b2 31.5000 
b3 24.0000 
b4 29.0000 
27.5000 
b1 25.0000 
b2 29.0000 
b3 22.0000 
b4 26.5000 
25.6250 
b1 30.0000 
b2 29.0000 
b3 27.0000 
b4 28.5000 
28.6250 
b1 32.0000 
b2 39.5000 
b3 35.0000 
b4 32.0000 
34.6250 
28.1250 
32.2500 
27.0000 
29.0000 
29.0938 


S 


0 0 0 0A|0O|N N NN N|O|N N N N|V0 NN N N NON N N N 


wm 
N 


Es importante recalcar que las hipótesis que se someten a prueba en este modelo no son hipótesis 
sobre medias (como en el modelo 1) sino hipótesis sobre varianzas, ya que el investigador no selecciona 
niveles concretos cuyas diferencias le interesen específicamente. Así, para el efecto factorial de orden 
(AM, Ho: a? = 0, para el efecto factorial de expertos (B), Ho : ee = 0, y para el efecto interactivo (AB), 
Ho: o? p=0. El interés fundamental del modelo reside en la variación de los efectos de tratamiento. Por 
esta razón no se utilizan comparaciones entre medias de grupo cuando todos los efectos son aleatorios 
(modelo ID), como tampoco es usual la representación gráfica de los promedios de grupo, ni la aplicación 
de los efectos simples para el análisis de la interacción. 

Para probar empíricamente las hipótesis, los investigadores pueden utilizar uno de los dos procedi- 
mientos que comentamos más arriba, el enfoque clásico o el enfoque mixto. Con el enfoque clásico se 
reproduce una tabla ANOVA similar a la que se representa con modelos de efectos fijos, donde las su- 
mas de cuadrados (y los grados de libertad) se obtienen por mínimos cuadrados con el procedimiento 
de cálculo simplificado que expusimos en el capítulo anterior para el modelo de efectos fijos. Para el 
ejemplo 4.2 el procedimiento de cálculo con el enfoque clásico se detalla en el cuadro 4.7. 
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CUADRO 4.7 
Resumen de cálculo de las SC del ANOVA con efectos aleatorios 


Cantidades básicas Procedimiento de cálculo No términos 
11] =72/abn (931)? /32 =27086.281 1 
[4] = Y 42/bn (22012/8+...+ (277)2/8=27449.375 4 
[B]= E Bi/an (225)2/8+...+ (232)2/8 =27208.625 4 
[AB] =E FABS, /n (50?/2+...+(642/2=27654.500 16 
[R] = ELM DSi, (D(0.5+...+98)=310.5 | (1)(16)=16 
Sumas de cuadrados Procedimiento de cálculo G.libertad 
SCA =[4] - [1] 27449.375 -— 27086.281 = 363.094 3 
SCg =[B]- 11) 27208.625 -— 27086.281 = 122.344 3 
SCaz = [4B]- [4] —[B] + [1] 27654.5 — 27208.625- 

-27449.375 + 27086.2281 = 82.781 9 
SCr =[R] 310.5 16 
SCu =14B] - [1] 27654.5 — 27086.281 = 568.219 15 
SCr =[R]+[A4B]- [1] 310.5 +27654.5 — 27086.281 = 878.719 31 


La tabla ANOVA de descomposición de la variación se obtuvo con el paquete SPSS (salida 4.4), y uti- 
liza la descomposición clásica de la variación desarrollada para modelos con efectos fijos, pero algunos 
paquetes estadísticos (p. ej., SPSS) la han modificado convenientemente para albergar efectos aleato- 
rios, introduciendo la información esencial acerca de las medias cuadráticas empleadas para construir 
las razones F mediante una llamada informativa a pie de tabla. De esta manera, para calcular la razón 
F del efecto factorial de A, hay una llamada (con un superíndice) en el valor empírico de la razón que, 
consultando la información a pie de tabla, nos indica que se ha utilizado como denominador MC ap. 


SALIDA 4.4 
Tabla ANOVA del modelo interactivo (enfoque clásico) 


Variable dependiente: total 


Fuentes 
Modelo 


SC tipo HI MC 
568.219 37.881 
A (orden) 363.094 121.031 
B (experto) 122.344 40.781 
AB (orden x experto) 82.781 9.198 
Residual 310.500 19.406 
Total 878.719 
4 MC(AB); ? MC(Residual) 


La salida 4.4 es un ANOVA en formato clásico para efectos fijos que ha sido modificado para incluir 
efectos aleatorios. La interpretación difiere en función de los componentes utilizados para construir las 
razones F. Pero el enfoque clásico no distingue apropiadamente efectos fijos y efectos aleatorios. 

Con el enfoque mixto se utiliza estimación por máxima verosimilitud restringida (estimación REML, 
REstricted Maximum Likelihood) separando los efectos fijos de los efectos aleatorios. En muchas ocasio- 
nes donde se usan modelos simples o se cumplen las condiciones de regularidad, la salida del enfoque 
clásico y la del enfoque mixto producirá resultados similares. Pero con modelos complejos o que no 
cumplan las condiciones de regularidad, ambas salidas no producirán los mismos resultados. La única 
alternativa aceptable en estos casos es el enfoque mixto. 
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La salida 4.5 resume de forma compacta la información esencial producida por el enfoque mixto. 
La primera parte informa de la estructura de covarianza asumida por el modelo y de la cantidad básica 
LL (el logaritmo de la verosimilitud obtenido con el procedimiento de estimación REML), la desvianza 
(D), definida como D = —2LL con el número de parámetros (q) y los criterios AIC (véase ecuación 1.10) 
y BIC, que son también funciones de LL. El número de parámetros (q) empleado por el modelo se re- 
presenta entre paréntesis junto a la desvianza y puede determinarse simplemente del resto de la salida. 
En concreto, hay cuatro parámetros aleatorios y una constante fija, y por tanto el modelo utiliza un total 
de 5 parámetros. La segunda parte de la salida presenta todos los efectos aleatorios del modelo con sus 
estimadotres, errores típicos, Z de Wald y su probabilidad. La tercera parte es un ANOVA clásico con los 
efectos fijos. El proceso de cálculo resultó no obstante problemático con el programa SPSS, porque no 
se alcanzó el criterio de convergencia en el proceso iterativo, como se informa a pie de tabla. 


SALIDA 4.5 
ANOVA factorial interactivo (enfoque mixto) 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de la varianza -92.922* 185.844 (5) 193.844 199.580 
Efectos aleatorios 
Parámetros Estimador E. Típico Zde Wald | P>|Z| 
Varianza a 13.163 12.365 1.064 .287 
Varianza ae 3.131 4.199 0.746 456 
Varianza 07, 0.000 0.000 - - 
Varianza o? 15.731 4.449 3.536 .000 
Efectos fijos 
Fuentes de variación gl glo F P>F 
Constante 1 3.918 185.419 .000 


* No se alcanzó el criterio de convergencia (SPSS) 


El modelo ajustado con el enfoque clásico (salida 4.4) y con el enfoque mixto (salida 4.5) es un mo- 
delo interactivo. Sin embargo, como en el caso del ANOVA con efectos fijos, en el ANOVA con efectos 
aleatorios hay también tres modelos posibles: el modelo nulo (ningún efecto factorial), el modelo adi- 
tivo (efectos principales o marginales de A y B) y el modelo interactivo (efectos principales más efecto 
factorial de la interacción A x B). Como se observa en la salida 4.4 del enfoque clásico, el componente 
interactivo no resultó significativo: F(9,16) = 0.474; P = .871, y por tanto puede descartarse el modelo 
interactivo. En el enfoque mixto, aunque la estimación no fue totalmente satisfactoria, la estimación de 
la varianza o? y Tue cero. Procede por tanto ajustar el siguiente modelo de la jerarquía, el modelo aditivo, 
que se muestra en la salida 4.6 con el enfoque clásico y en la salida 4.7 con el enfoque mixto. 


SALIDA 4.6 
Tabla ANOVA del modelo factorial aditivo (enfoque clásico) 
Variable dependiente: respuesta 
Fuentes SC tipo IM MC 
Modelo 485.438 80.906 
A (orden) 363.094 121.031 


B (experto) 122.344 40.781 
Residual 393.281 15.731 
Total 878.719 
4 MC(Residual 


OEdiciones Pirámide 


170 Diseños de investigación en Psicología 


SALIDA 4.7 
ANOVA factorial aditivo (enfoque mixto) 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de la varianza 92.922 185.844 (4) 191.844 196.146 
Efectos aleatorios 
Parámetros Estimador E. Típico Zde Wald | P>|Z| 
Varianza as 13.163 12.365 1.064 .287 
Varianza Co 3.131 4.199 0.746 A56 
Varianza al 15.731 4.449 43.536 .000 
Efectos fijos 
Fuentes de variación gl glo F P>F 
Constante 1 3.918 185.419 .000 


Las salidas 4.4 y 4.6 con el enfoque clásico no reportan componentes de varianza, pero las salidas 
del enfoque mixto 4.5 y 4.7 sí. El cálculo de los componentes de la varianza puede no obstante realizarse 
utilizando el método de los momentos con las razones F de la salida del enfoque clásico (véase cuadro 
4.5) teniendo en cuenta las esperanzas de las medias cuadráticas (cuadro 4.4). Pero para estimar los 
componentes de la varianza con el modelo II hay que introducir dos cambios respecto del modelo 1. El 
primer cambio es que la estimación se obtiene, como es usual, calculando la diferencia entre las medias 
cuadráticas de numerador y denominador de la razón F (pero no necesariamente tiene que ser MCr 
en el denominador, sino la que determine la esperanza de la media cuadrática correspondiente), y el 
segundo cambio es que se multiplica después el resultado por los niveles del factor (recuérdese que en 
el modelo 1 se multiplicaba por sus grados de libertad). Además, en el caso de una estimación negativa 
para un componente, por convención se toma como estimación cero, ya que una varianza negativa es 
absurda. Así, utilizando los resultados de la salida 4.4 (modelo interactivo), aunque el modelo no ajusta 
aceptablemente, la estimación de los componentes de la varianza con el enfoque clásico sería: 


(aNMCA— MCag) _ (4)(121.031- 9.198) 


dez = 13.979 

N 32 a 
bDI(MC¿- MC 4)(40.781 — 9.198 

62 = (DUMC5-MCa) _ (0 ON 
N 32 OE 

2 (ANPNMCAB-MCR) _ (0(4)0.198- 19.406) 

Cab N _ 32 ES 

6% = MCz=19.406 


mientras que, utilizando los resultados de la salida 4.6 (modelo aditivo), la estimación de los compo- 
nentes de la varianza con el enfoque clásico es la siguiente: 


(aN(MCA— MCp) _ (4(121.031- 15.731) 


da -= = 13.163 
N 32 
bNMCg- MC 4)(40.781 — 15.731 
e. O a O] ze a 


Observe que, utilizando el enfoque clásico, las varianzas de A y B son diferentes en los modelos interac- 
tivo y aditivo, mientras que los resultados obtenidos con el enfoque mixto con los modelos interactivo y 
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aditivo son exactamente iguales. El modelo mixto detecta la irrelevancia del efecto de AB y lo anula, por 
lo que la información relativa a los componentes de la varianza en las salidas 4.5 y 4.7 es exactamente la 
misma, a pesar de tratarse de un modelo diferente. 

En correspondencia con el uso de omega cuadrado para evaluar la magnitud del efecto con el mode- 
lo I mediante el método de los momentos, el modelo Il usa la correlación intraclase en lugar de omega 
cuadrado. Para el modelo interactivo hay tres efectos de tratamiento (4, B y AB) y la suma de las varian- 
zas de todas las fuentes de variación estima la varianza total: 0% = 13.979 + 3.948 + 0+ 19.406 = 37.333. 
Una vez conocida la estimación de la varianza total, las estimaciones de la correlación intraclase para el 
modelo interactivo son: 


a ó% _ 13.979 
Pr 07+02+0%, +02 37.333 == 
52 
0] 3.948 
15% = 223,42 — E =.106 
¿+07 +07, +06 37.333 
52 
A 9 0 
pj” = 22 A2 o 227 =0 
07+07,+07,+0% 37.333 


ZA 0% 13.163 
O e ra = 411 
0¿+07 +67  15.731+13.163+3.131+ 
42 
ó 3.131 
o = ==” = .098 
07+62+62 —15.731+13.163+3.131 


Adviértase que con el enfoque clásico las correlaciones intraclase de los modelos interactivo y aditivo 
son diferentes, mientras que en el enfoque mixto son iguales. Nótese también que la fórmula de cálculo 
de la correlación intraclase depende de las estimaciones de los componentes de la varianza, y éstas a 
su vez dependen de las esperanzas de las medias cuadráticas. En la sección 4.3 de este mismo capítulo 
desarrollamos un algoritmo sencillo para obtener las E(MC) de cualquier modelo ANOVA. 

Si sólo se conoce la razón F de los efectos (p. ej., si se tiene acceso a un informe de investigación 
publicado), la forma más apropiada para estimar las correlaciones intraclase p, es una adaptación de la 
ecuación 3.36, donde los grados de libertad se sustituyen por el número de niveles de factor. Así, para 
obtener la correlación intraclase para un efecto ¡ en el modelo aditivo se aplica la fórmula siguiente: 


; E¡=1 
¡> a e (4.18) 
2 UN Ej-D1+N 


0 


donde ¡ se refiere a cualquiera de los componentes del modelo. Así, siendo F4 = 7.694, con a= 4 niveles 
y F5 = 2.592, también con b = 4 niveles (información que debe aparecer en un artículo publicado), 
la magnitud del efecto de A sería p? = [(4)(6.694)] /[(4) (6.694) + (4) (1.592) + 32] = 0.411, y la magnitud 
del efecto de B sería 27 = [(4) 1.592)]/[(4) (6.694) + (4) (1.592) + 32] = 0.098. Y consultando la salida 4.6 
y la tabla G (a = .05), siendo F¿y¡1(3,25) = 2.991, la potencia del efecto de A es Pa = 0.762 y la de B es 
Pg = 0.346, ninguna de las cuales alcanza el límite mínimo recomendado de 0.80. 
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4.3.6. ANOVA con efectos mixtos 


El modelo ANOVA con dos factores aleatorios es muy raro en la literatura de investigación psicoló- 
gica. Mucho más común es encontrar situaciones donde se combina un factor fijo y un factor aleatorio. 
El ejemplo 4.3 (tomado también de Hays, 1988, p. 504) es una investigación para estudiar la tensión 
muscular inducida (tenmusc) en niños de 5% de escuelas públicas de una gran ciudad norteamericana 
mediante tres tipos de tareas: la primera es la solución de problemas de aritmética; la segunda es una 
corta composición y la tercera es un dibujo complejo. Dado el gran número de clases de 5* existentes 
en la ciudad, se optó por seleccionar al azar un total de seis clases que participaron finalmente en el 
experimento. Para cada combinación de clase y tarea se tomaron un total de n = 2 réplicas. Puesto que 
el factor tareas es fijo y el factor clases aleatorio, el modelo ANOVA resultante es un modelo con efectos 
mixtos. El cuadro 4.8 contiene los datos empíricos. 


CUADRO 4.8 
Datos empíricos ejemplo 4.3 
tareas (B) 
clases (A) b2 
al a E 111 12.0 


al : s 113 10.6 


a3 A B 9.8 10.1 
as a 114 10.5 
as 13.0 11.7 
a6 E 122 12.3 


Por su parte, la salida 4.8 es un resumen descriptivo de los datos en el mismo formato utilizado a lo 
largo del texto, aportando medias, sumas, varianzas y réplicas para cada combinación de tratamientos. 


SALIDA 4.8 
Análisis descriptivo de los datos del ejemplo 4.3 
V. dependiente: tenmusc 

tareas | Media 
b1 8.2500 
b2 11.5500 
b3 10.8500 
b1 8.6000 
b2 10.9500 
b3 10.8500 
b1 5.4500 
b2 9.9500 
b3 12.1500 
b1 9.8500 
b2 10.9500 
b3 8.0000 
b1 9.9500 
b2 12.3500 
b3 8.1000 
b1 9.6500 
b2 12.2500 
b3 9.5500 


N NN NN NNDNVNNONDN DyN). NNNDN DS 
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El modelo matemático de un ANOVA de dos factores con efectos mixtos (con A aleatorio y B fijo) se 
formula mediante 


Yijk =M+ 03+ Br+(a6) ¡r+ijk (4.19) 


donde aj es un efecto aleatorio para la variable de fila A, Pz es un efecto fijo para la variable de columna 
B y (aB) ;x es el efecto de interacción asociado a la observación media de la casilla ¡k. Los supuestos de 
este modelo son los siguientes: 


— los efectos aj y (AB) jk son variables aleatorias con distribución NID(O, 0?) y NID(O, ap) respec- 
tivamente; 


— los errores €¡¡k Se distribuyen según NID(O, a); 
— los efectos aj, PBry (AB) jr son independientes de los errores €ijki 


— los términos de error e; ¡; son mutuamente independientes entre sí, 


y las hipótesis que se someten a prueba en el modelo III son, para el efecto factorial de clases (factor A), 
Ho: a? = 0, para el efecto factorial de tareas (factor B), Ho : 4.1 = 2 = Ha y para el efecto interactivo, 
Ho: ar e 0. 

Estas hipótesis son en parte hipótesis sobre medias (en concreto, las que conciernen al factor fijo B) y 
en parte hipótesis sobre varianzas (en concreto, las que conciernen al factor aleatorio A y ala interacción 
A x B). El interés del modelo se concentra simultáneamente en las diferencias de medias del factor fijo 
y en los componentes de la varianza de los efectos aleatorios. Por esta razón, solamente se contemplan 
comparaciones entre medias de grupo para el factor fijo. En el caso de interesar la aplicación del análisis 
de los efectos simples, en este tipo de modelos solamente puede practicarse para los efectos de un factor 
(que se asume aleatorio) para cada uno de los niveles de otro factor (que se asume fijo). En este ejemplo 
solo cabe aplicar por tanto los efectos simples de A (clases) para cada uno de los niveles de B (tareas). El 
procedimiento de cálculo se exhibe en el cuadro 4.9. 


CUADRO 4.9 
Procedimiento de cálculo de las SC para ANOVA factorial efectos mixtos 


Cantidades básicas Procedimiento de cálculo No términos 
(1 =72/N (358.5)2/36 = 3570.063 1 

LA] =YE A5/bn (61.32/6+...+ (62.92/6=3576.859 6 

[B] = Y Bé/an (103.5)2/12 + (136)2/12+ (1192/12 =3614.104 3 
[AB] = E E ABS, /n (16.5)7/2+...+(19.1)?/2= 3679.096 16 

[R] = EX (Mig DSi, (1)00.495+...+1.805) = 14.535 | (1)(18)=18 
Sumas de cuadrados Procedimiento de cálculo G. libertad 
SCA=[4]- [1] 3576.859 — 3570.063 = 6.796 5 

SCg =[B]- [1] 3614.104— 3570.063 = 44.042 2 
SCag =[4B]-[4]-[B]+[1] | 3679.096-—3576.859 — 3614.104 + 3570.063 = 58.195 10 
SCr=[R] 14.535 18 
SCy=[4B] - [11 3679.096—3570.063 = 109.033 17 
SC =[R]+[4B]- [1] 14.535 + 3679.096 — 3570.063 = 123.568 35 
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La tabla ANOVA del enfoque clásico para el modelo interactivo se muestra en la salida 4.9. Puesto que 
el componente de interacción es significativo, aplicando el principio de marginalidad se puede concluir 
que el modelo interactivo es el modelo óptimo, donde puede examinarse la interacción analizando los 
efectos simples de A (el factor aleatorio) para cada uno de los niveles de B (el factor fijo). Observe que no 
es posible aplicar los efectos simples de B para cada uno de los niveles de A, porque los niveles del factor 
A no son valores prefijados sino seleccionados al azar de una población de niveles. El efecto interactivo 


es intuitivamente visible en la figura 5.5, que muestra los perfiles de las medias de clases para cada una 
de los niveles de tareas. 


SALIDA 4.9 
Tabla ANOVA del modelo interactivo (modelo III) 
Variable dependiente: respuesta 
Fuentes SC tipo III 
Modelo 109.033 
A (clases) 6.796 
B (tareas) 44.042 


AB (clases x tareas) 58.195 
Residual 14.535 
Total 123.568 
4 MC(A*B); Y MC(Residual) 


tareas 
=$ 1 
2 
mb 3 


tenmusc 


clases 


Figura 4.1. — Gráfico de la interacción del ejemplo 5.3. 
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Por su parte, la salida 4.10 muestra los efectos simples de las clases para cada nivel de tareas. Re- 
cuerde que solamente se pueden analizar los efectos simples del factor aleatorio para cada uno de los 
niveles del factor fijo, porque el factor aleatorio no considera niveles prefijados. La salida revela que 
existen diferencias significativas entre las clases para las tareas b1 y b3, pero no para b2. La observación 
de la interacción revela una ejecución antagónica para las tareas 1 (problemas de aritmética) y 3 (dibujo 
complejo) mientras que la tarea 2 (composición corta) tiene cierta similitud con la tarea 1. 


SALIDA 4.10 
Efectos simples de clases para cada nivel de tareas 


Variable dependiente: tenmusc 

Efecto de clases | SC tipo IM 

b1 Contraste 20.057 
Error 14.535 


b2 Contraste 8.257 
Error 14.535 
b3 Contraste 27.677 
Error 14.535 


Las esperanzas para las medias cuadráticas para un modelo mixto con A aleatorio y B fijo, asumien- 
do el modelo no restrictivo para las E(MC), son similares a las del modelo de efectos aleatorios. Los 
componentes de varianza se obtienen fácilmente calculando la diferencia entre numerador y denomi- 
nador de la razón F, multiplicada por los niveles de efecto (si el factor es aleatorio) o sus grados de 
libertad (si el factor es fijo), y dividida por el total muestral: 


MCA-M 6)(1.359 — 5.820 
62 = MMCA-MCas) _ (6X e 
N 36 HA 
é% Ñ (b- 1)(MC¿- MCag) a (2)(22.021 — 5.820) 0500 
N 36 7 
DIM -M 18) (5.820 — 0.808 
62, = 0 En Cr) _ (18) 29-090) o 596 


y la estimación de la varianza total resulta: 6% = 0+.9+2.516+.808 = 4.214. 

Un valor nulo del componente de varianza para A(clases) indica que el factor no tiene ninguna re- 
levancia y, por supuesto, no será estadísticamente significativo. De hecho, aunque su interpretación 
violaría el principio de marginalidad, la prueba F para comprobar la hipótesis nula Hp : 0% =0 no per- 
mitiría rechazarla: F(5, 10) = 0.234; P = .939 (véase salida 4.9). La estimación de la magnitud del efecto 
sería p? = 0/4.214=0 y, siendo 95 FA(5, 10) = 3.326, la potencia sería también P4 =0 (véase tabla G). 

El efecto factorial fijo de tareas, aunque su interpretación también violaría el principio de margi- 
nalidad, estrictamente tampoco permitiría rechazar la hipótesis nula Hp : 9; = 0 al nivel de significa- 
ción del 5%, ya que F(2, 10) = 3.784; P = .060 (salida 4.9), aunque ciertamente se encuentra en el límite 
de significación. Aplicando el método de los momentos, el estimador de la magnitud del efecto sería 
0% = .900/4.214 = .214 y, siendo A= (2)(3.784) = 7.568, la potencia observada es Pg = .589 (tabla D). 

El efecto de interacción resulta estadísticamente significativo: F(10,18) = 7.203; P < .001. La inter- 
pretación de este efecto debe concentrar toda la atención del investigador puesto que, de acuerdo con 
el principio de marginalidad, en presencia de una interacción significativa, los efectos principales no 
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deben ser objeto de interpretación sustantiva. La estimación de la magnitud del efecto de interacción 
es as = 2.506/4.214 = 0.595 (o sea, casi un 60% de la varianza de la variable de respuesta), y siendo el 
valor crítico 95 F/P (10, 18) = 2.412, la estimación de la potencia observada es P4g = .959 (tabla G). 

El enfoque mixto es, hoy por hoy, la mejor opción analítica para el ANOVA con efectos aleatorios 
o mixtos. La salida 4.11 es un resumen compacto de los principales resultados proporcionados por los 
paquetes GENSTAT, SAS, STATA, SPSS Ó R, en la misma línea interpretativa de salidas 4.2, 4.5 y 4.7 
anteriores. Sin embargo, los paquetes profesionales presentan algunas discrepancias en los grados de li- 
bertad para los efectos fijos (p. ej., SPSS y STATA asignan 15 grados de libertad para el denominador del 
efecto de tareas, al considerar irrelevante el efecto de clases, mientras que GENSTAT, SAS y Rle asig- 
nan solamente 10, el mismo valor que le asigna el enfoque clásico). Para superar esta discrepancia, que 
puede afectar a los resultados de las pruebas estadísticas, hemos optado por reproducir los resultados 
de SAS por presentar mayor congruencia con el enfoque clásico. 

Hay algunos detalles a destacar de la salida 4.11 que conciernen a las diferencias entre el enfoque 
clásico y el enfoque mixto. Obsérvese, en primer lugar, que en el enfoque clásico el efecto de las tareas 
no es significativo, mientras que en el enfoque mixto sí. En segundo lugar, las estimaciones de los pa- 
rámetros aleatorios difieren en lo que concierne a la varianza del efecto de la interacción, ya que en el 
enfoque clásico el estimador del parámetro as pes o? p = 2.506, mientras que en el enfoque mixto el mis- 
mo estimador es 07h = 1.763. Además, el parámetro para la constante o intercepción no se incluye (pero 
se asume) cuando hay algún efecto fijo principal. Finalmente, la aplicación del principio de marginali- 
dad sólo afecta al componente fijo (porque se trata de medias marginales), pero no afecta en absoluto a 
los componentes aleatorios. Puesto que la interacción clasesx tareas es significativa, el investigador debe 
concentrar su interpretación en el efecto interactivo (aleatorio), y en el efecto del factor tareas (fijo). 


SALIDA 4.11 
ANOVA factorial interactivo (enfoque mixto) 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de la varianza -59.625* 119.249 (6) 125.249 129.739 
Efectos aleatorios 
Parámetros Estimador E. típico Zde Wald | P>|Z| 
Varianza 0% 0.000 0.000 w a 
Varianza va b 1.763 0.802 2.197 .028 
Varianza a? 0.808 0.269 3.000 .003 
Efectos fijos 
Fuentes de variación gl glo F P>F 
tareas 2 10 5.082 .021 


* No se alcanzó el criterio de convergencia 


4,4. UNALGORITMO PARA ESTIMAR LOS VALORES ESPERADOS 


4.4.1. Introducción 


La construcción de razones F para modelos de efectos fijos es muy sencilla e implica utilizar la MCr 
como denominador para probar todos los efectos factoriales principales e interactivos. Sin embargo, 
cuando alguno de los factores es aleatorio, la construcción de razones F ya no sigue una regla tan sen- 
cilla, en particular cuando el número de factores aumenta. Se hace preciso en tales casos derivar los 
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valores esperados de las medias cuadráticas para construir las razones F apropiadas y los estimadores 
de los componentes de la varianza. 

Desgraciadamente no existe una opinión unánime acerca de cómo obtener los valores esperados 
de las medias cuadráticas (Searle, Casella y McCulloch, 2006). La alternativa clásica corresponde a lo 
que se ha dado en llamar modelo no restrictivo, pero otros autores consideran más conveniente una 
alternativa que corresponde al denominado modelo restrictivo. La mayoría de los paquetes estadísticos 
(p. ej., SPSS y SAS) optan en sus aplicaciones por la alternativa clásica. La definición de un modelo no 
restrictivo se fundamenta en el principio de que todo efecto factorial que contenga al menos un factor 
aleatorio se considera también aleatorio. Así, si un efecto interactivo resulta de la combinación de un 
efecto aleatorio con un efecto fijo el resultado es un efecto interactivo aleatorio. Por el contrario, la defi- 
nición de un modelo restrictivo se basa en el principio de que un efecto factorial interactivo se considera 
aleatorio cuando es el resultado de combinar un efecto de cualquier naturaleza (fijo o aleatorio) tomado 
como base con un efecto factorial que sea estrictamente aleatorio. 

Un algoritmo muy sencillo para derivar los valores esperados de las medias cuadráticas para el mo- 
delo no restrictivo consiste en aplicar una serie de cuatro reglas, la última de las cuales tiene carácter 
iterativo. Este algoritmo se aplica exclusivamente a modelos no restrictivos. Sin embargo, una vez apli- 
cado es muy simple conmutar a un modelo restrictivo, ya que las E(MC) de un modelo restrictivo se 
obtienen eliminando ciertos efectos de la E(MC) del modelo no restrictivo. 


— Regla 1. En una tabla de doble entrada, escriba en primer lugar una columna con tantas filas co- 
mo fuentes de variación tenga el modelo. Las fuentes de variación de un modelo incluyen todos 
los efectos principales e interactivos más el término residual. Así, para un modelo completo con 
tres factores, hay 8 fuentes de variación, a saber, tres efectos principales (4, B y C), tres efectos 
interactivos de primer orden (AB, AC y BC), un efecto interactivo de segundo orden (ABC) y un 
término residual (R). Escriba a continuación en la primera fila y ocupando diferentes columnas 
los tres componentes de que consta una E(MO), a saber, un componente Común, un componente 
Específico y, si existen, un (o más) componente Adicional. Asumiendo un modelo no restrictivo, 
escriba después entre paréntesis junto a cada una de las fuentes de variación especificadas si se 
trata de un efecto fijo (f) o aleatorio (a). La regla general que se aplica en el modelo no restrictivo 
es que se considera un efecto interactivo como aleatorio si al menos uno de los factores que con- 
tiene es aleatorio. Para ilustrar el procedimiento, asumimos un modelo con dos factores aleatorios 
Ay B,con a=3 y b= 4 niveles, y un factor fijo C, con c= 2 niveles, donde se han utilizado un total 
de n=5 réplicas; el resultado de la aplicación de la regla 1 se muestra en el cuadro 4.10. 


CUADRO 4.10 


Aplicación de la Regla 1 (modelo no restrictivo) 


Fuentes de E(MC) 
variación Específico | Adicional 


INAAA>28a80s9 


Residual 
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— Regla 2. Para todas las fuentes de variación, incluya en la columna que corresponde al componen- 
te común la varianza residual 0?, que suponemos constante para todos los efectos del modelo, y 
para el término residual. Véase el resultado de la aplicación de la regla 2 en el cuadro 4.11. 


CUADRO 4.11 


Aplicación de la regla 2 (modelo no restrictivo) 


Fuentes de E(MC) 
variación ú Específico | Adicional 
(a) 
(a) 
0) 


(a) 
(a) 
(a) 
(a) 
Residual (a) 


— Regla 3. Para cada una de las fuentes de variación, incluya en la columna correspondiente al com- 
ponente específico el efecto propio de cada fuente de variación precedida de sus constantes o 
multiplicadores. Por ejemplo, el componente específico para C es nab0?, donde nab son sus 
constantes o multiplicadores. Obsérvese que, para cada fuente de variación, las constantes son 
el producto de los niveles de las variables no involucradas en la fuente de variación y el número 
de réplicas. Así, el componente para C se asume marginal al número de niveles a, de b y de las 
réplicas n, y por tanto sus multiplicadores son nab = (5)(3) (4) = 60. Del mismo modo, el compo- 
nente específico para A es la varianza nbco?, donde nbc = (5)(4)(2) = 40 son sus constantes y el 
componente específico para AB es también la varianza nco% y» donde nc = (5)(2) = 10 son sus 
constantes. El resultado de la aplicación de la regla 3 se muestra en el cuadro 4.12. 


CUADRO 4.12 
Aplicación de la regla 3 (modelo no restrictivo) 
Fuentes de E(MC) 
variación ú Específico | Adicional 
(a) 
(a) 
MW 


(a) 
(a) 
(a) 
ABC (a) 
Residual (a) 


— Regla 4. Finalmente se aplica un algoritmo iterativo para obtener los componentes adicionales 
correspondientes a cada fuente de variación. El algoritmo consiste en preguntar, de forma jerár- 
quica y para cada una de las fuentes de variación del modelo, si los efectos factoriales superiores 
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en la jerarquía que incluyen la fuente sometida a prueba son o no aleatorios. Para un determina- 
do efecto principal, son efectos factoriales jerárquicamente superiores los efectos interactivos de 
primer orden y el efecto interactivo de segundo orden que incluyen el efecto principal. Por ejem- 
plo, para el efecto principal de B, son efectos jerárquicamente superiores AB, BC y ABC. Para un 
efecto interactivo de primer orden, son efectos jerárquicamente superiores el efecto interactivo de 
segundo orden. La misma idea se aplica en modelos factoriales más complejos. Por ejemplo, para 
el efecto AC, el efecto jerárquicamente superior es ABC. Si la respuesta a una cuestión planteada 
es afirmativa, entonces deberá incluirse en la columna correspondiente al componente adicional 
el componente específico del efecto factorial jerárquicamente superior objeto de la pregunta; si 
por el contrario es negativa, no se incluirá nada en la columna del componente adicional. Así, 
aplicando el algoritmo a la fuente A se determina primero qué componentes jerárquicamente su- 
periores incluyen A. Son obviamente AB, AC y ABC. Desde la fuente A se comienza el algoritmo 
cuestionando si la interacción AB es aleatoria. Cuando se aplicó la regla 1, anotamos entre parén- 
tesis en la fila que corresponde a la interacción AB que es aleatoria. En consecuencia, puesto que 
la respuesta a la cuestión es afirmativa, es preciso incluir como componente adicional de la fuente 
A el componente específico para AB, que copiamos de la fila correspondiente: 10 El algorit- 
mo prosigue desde la fuente A cuestionando después si la interacción AC es aleatoria. Puesto que 
la respuesta es afirmativa, deberá incluirse como componente adicional para A el componente 
específico para AC, que copiamos de la fila correspondiente: 200 y. Y finalmente, desde la fuen- 
te A se cuestiona si el componente de interacción de segundo orden ABC es también aleatorio. 
Puesto que la respuesta es también afirmativa deberá incluirse como componente adicional para 
A el componente específico para ABC, que se toma de la fila correspondiente: 50 py Al no haber 
otros componentes jerárquicamente superiores, el proceso para A se considera completado. 


El mismo proceso se aplica a las restantes fuentes de variación del modelo (B, C, AB, AC y ABC). 
El algoritmo concluye cuando llega al componente interactivo superior de la jerarquía, que es 
ABC, que no admite ninguna pregunta porque no tiene términos jerárquicamente superiores. 
Por ejemplo, cuando el algoritmo llega a AC se determina qué componentes jerárquicamente su- 
periores a AC existen. El único componente superior es ABC. El algoritmo cuestiona desde AC 
si ABC es aleatorio. Puesto que la respuesta es afirmativa, se coloca en la línea correspondiente a 
AC como componente adicional no by" El resultado final se muestra en el cuadro 4.13. 


CUADRO 4.13 
Aplicación de la regla 4 (modelo no restrictivo) 
Fuentes de E(MC) 
variación ú Específico | Adicional 
100%, +200%y +50 


2 
aby 
2 
aby 
2 
aby 


1007, + 150%, +50 


200%, + 150%, +50 


2 
5 aby 


2 
50 aby 


2 
50 aby 


Residual 
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Asumiendo por tanto un modelo no restrictivo, las E(MC) para cada una de las fuentes de variación 
del modelo se obtienen, una vez completado el proceso algorítmico, directamente de la última tabla 
de doble entrada (cuadro 4.13), sumando el componente común primero, después los componentes 
adicionales y finalmente el componente específico. El cuadro 4.14 es el resultado final del proceso. 


CUADRO 4.14 
E(MO) bajo el modelo III no restrictivo 


Fuentes E(MC) 

07+50%,, +100%, +200 y + 400% 
2 2 
aby aby 
05 +200%y + 150%, +50% e 600% 

2 

aby 

a? + 50% by 


by 


az+50%, +100?, + 150%, +50%, +300% 


0%+50 


a + 50% by 
ABC a2+50? 


aby 


Residual | 0? 


Si por el contrario el investigador decide trabajar con el modelo restrictivo, la mejor manera de pro- 
ceder es partir del resultado obtenido con el modelo no restrictivo, que se llama así porque las E(MC) 
de cada uno de sus componentes contienen todos los términos posibles. El modelo restrictivo, en cam- 
bio, prescinde de algunos de los términos que contiene el modelo no restrictivo dentro de la columna de 
componentes adicionales. Para proceder a la eliminación de los términos sobrantes es necesario utilizar 
una modificación de la regla 4 sobre la salida resultante de la aplicación del modelo no restrictivo (cua- 
dro 4.13), eliminando las referencias a fijo (f) o aleatorio (a) para los efectos interactivos y subrayando 
para cada fuente de variación el/los componente/s adicional/es que no son necesarios. La regla 4 mo- 
dificada procede de la misma forma que la anterior regla 4 sobre cada una de las fuentes de variación 
pero considerando ahora un componente jerárquicamente superior como aleatorio cuando el término 
(o términos) que se adicionan es/son aleatorio(s). Así, cuando desde la fuente A cuestionamos si el com- 
ponente jerárquicamente superior AB es aleatorio, la respuesta será afirmativa si B (el término que se 
adiciona a A, que es la fuente desde donde procede la pregunta) es aleatorio, pero negativa si no lo es. 
En el ejemplo, B es aleatorio y por tanto la E(MC) del componente adicional AB debe mantenerse en la 
E(MC). Del mismo modo, preguntando desde la fuente A si el componente jerárquicamente superior 
AC es aleatorio, la respuesta será afirmativa si C es aleatorio y negativa si no lo es. Puesto que C es fijo, 
la respuesta es negativa y por tanto la E(MC) para el componente adicional AC debe eliminarse, proce- 
diendo a subrayar el componente adicional a eliminar. Finalmente, preguntando desde la fuente A si el 
componente jerárquicamente superior ABC es aleatorio, la respuesta será afirmativa si tanto A como B 
son ambos aleatorios, pero negativa si alguno o los dos componentes no son aleatorios. En el ejemplo, B 
es aleatorio pero C no. En consecuencia, la respuesta es negativa y la E(MC) del componente adicional 
ABC también debe ser eliminado, procediendo por tanto a subrayar el componente adicional ABC en la 
fuente de variación A. El resultado final del proceso se muestra para la línea correspondiente a la fuente 
de variación para A del cuadro 4.15, donde se han subrayado los componentes adicionales de AC y de 
ABC. Del mismo modo se procede con las restantes fuentes de variación. Por ejemplo, desde la fuente 
AB se cuestiona si el componente jerárquicamente superior ABC es aleatorio. Puesto que el término 
que se adiciona a AB para el componente ABC es C, y C es fijo, la respuesta será negativa, procediendo 
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por tanto a subrayar el componente adicional ABC correspondiente a la línea AB. El resultado final del 
proceso se resume en el cuadro 4.15 incluyendo primero componentes comunes, después específicos y 
finalmente adicionales. Las E(MC) del modelo restrictivo se resumen en el cuadro 4.16. 


CUADRO 4.15 
Aplicación de la regla 4 modificada (modelo restrictivo) 


Fuentes de E(MC) 


variación ú Específico | Adicional 


2 2 2 2 
(a) 400% 1007, + 200 gy +50 py 


2 2 2 2 
(a) 3007, 1007; + 1507, +50 py 


2 2 2 
09) 200 qy + 150, +50 


aby 


ABC 
Residual (a) 


CUADRO 4.16 
E(MO) bajo el modelo III restrictivo 


Fuentes E(MC) 
07+100%, +400% 


05+1007,, +300% 


E 2 2 2 2 2 
05 + 3 by +200 cy + 150, + 5 py + 600; 


2 2 
a+ 100%, 


ABC 


Residual 


4.4.2. Construcción de las razones F en los modelos Il y III 


La construcción de las razones F tiene lugar a partir de las E(MC) obtenidas en los cuadros 4.14 (pa- 
ra el modelo no restrictivo) o bien 4.16 (modelo restrictivo). El principio básico para construir una razón 
F procede de la TEORÍA DE LA DETECCIÓN DE SEÑALES (Signal Detection Theory) introducida en la Psico- 
logía por Tanner y Swets (1954), donde el estudio de una señal debe tener en cuenta el ruido de fondo 
que la corrompe. En aplicaciones estadísticas, el principio argumenta que lo único que debe distinguir 
el numerador del denominador de una razón F es el efecto sometido a prueba, o sea el numerador debe 
contener (Ruido+Señal), mientras que el denominador solamente debe contener (Ruido). Puesto que la 
razón F para un determinado efecto factorial requiere para el numerador de la razón la media cuadrá- 
tica del efecto factorial (que es el único componente que contiene la Señal), para el denominador debe 
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elegirse una media cuadrática cuyo valor esperado contenga todos los elementos de la media cuadrá- 
tica del numerador con excepción del efecto que se prueba. Asumiendo el modelo no restrictivo, para 
probar el efecto factorial de AB, se plantea como hipótesis nula Hp: To. = 0, cuyo valor esperado es 


a 2 2 
E(MCnumerador) = 07+ 50 py + 100%), 
y por tanto se requiere como denominador una media cuadrática cuyo valor esperado sea 


2, 


E(MC denominador) = or + 50 py 


de tal forma que lo que diferencia numerador y denominador es que el numerador contiene una fuente 
adicional que no se incluye en el denominador. La media cuadrática que se precisa para el denominador 
es, como se observa en el cuadro 4.14, MCagc. En consecuencia, la razón F para probar el efecto AB se 
construye del siguiente modo 


El mismo principio (Ruido+Señal) /Ruido se aplica a las restantes razones F. 

Un caso especial sucede no obstante con la razón F para probar los efectos principales A, B y C del 
modelo no restrictivo y el efecto C del modelo restrictivo. Para el efecto A, con hipótesis nula Hp : a? =0, 
su valor esperado incluye, además de la varianza residual y de A, la de los efectos factoriales de AB, 
AC y ABC. No es posible encontrar para el denominador una media cuadrática que tenga como valor 
esperado los efectos de AB+ AC + ABC. En este caso se requiere encontrar una combinación lineal de 
medias cuadráticas para construir lo que se denomina una RAZÓN CUASI-E, de tal modo que se cumpla el 
principio básico de que el único componente que distingue numerador de denominador de la razón sea 
el efecto que se prueba, o sea, (Señal + Ruido)/Ruido. Una composición cuasi-F apropiada implicaría 
utilizar para el denominador el compuesto (MC + MCac— MC asc). En tal caso, los valores esperados 
de cada uno de los términos de la razón F para probar el efecto de A serían los siguientes: 


E(MCa) 
E(MCa) + E[MCac) - E(MCrx) 


2 2 2 2 
ae 100 7, +200 q, + 400%, 


Fa = 


02+50 


2 2 2 2 2 2 2 2 
(a+ SO py + 1007 ,,) + (05+ SO py + 200 cy) - (05+ 50 py) 
0+50% EE 1007, +200%, +400%, do 

07+50%,, 104 0%, + 200 ¿y ' 


Nótese que se han destacado para el denominador las E(MC) de los tres términos que debe contener 
(E(MCa), E(MCac) y E(MCagc)), para cumplir con el principio (Ruido+Señal) /Ruido. Con este desa- 
rrollo, todos los términos de numerador y denominador se cancelan entre sí, con excepción del término 
que es objeto de prueba, que para Fa es exactamente 4007, o sea la Señal, siendo el resto de los compo- 
nentes de numerador y denominador el Ruido. 

El mismo principio se aplica con las razones F para probar los efectos de B y C en el modelo no res- 
trictivo. Observe que con F4 se emplean en el denominador componentes que incluyen A (en concreto, 
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AB, AC y ABC). Para obtener Fp, el numerador debe contener E(MCp) y el denominador E(MCapg), 
E(MCsgc) y E[MCasc). Del mismo modo, para obtener Fc el numerador debe contener E(MCC¿) y el 
denominador E(MC ac), E(MCgc) y E(MCagc). 

El cuadro 4.17 resume para cada efecto factorial las hipótesis nulas que se plantean, el denominador 
y las razones F para el modelo mixto no restrictivo que se desarrolló en el cuadro 4.14. A destacar la 
configuración de razones F que se requieren en este caso, con tres cuasi-F (los efectos de A, B y C) y 
cuatro F (los efectos de AB, AC, BC y ABC). 


CUADRO 4.17 
Razones F para un ANOVA factorial (modelo mixto no restrictivo) 


Efecto G. libertad Hipótesis nula  Denominador Razón Fo cuasi-F 

A (a | (a-D Hp:0%4=0 AB+AC-ABC MCA/(MCag + MCac- MCasc) 
B (ay | (b-1D Ho:0%=0 AB+BC-ABC MCz/(MCAB + MCpc=MCagc) 
C (0 | (c-1) Ho:07=0 AC+BC-ABC MCc/(MCac + MCgc= MCagc) 
AB (a) | (a-D(6-D Ho:0%,=0 ABC MCa1/MCazsc 

AC (a) | (a-1D(c—-1) Ho: 0%y =0 ABC MCac/MCanc 

BC (a) | (c-1)(c—-1) Ho: 0%, =0 ABC MCgc/MCazsc 

ABC (a) | (a-1D)(b-1)(c-1) Ho: 0% =0 Residual MCasc!/MCr 

Residual N-abc 

Total N-1 


El cuadro 4.18 hace lo propio con el modelo mixto restrictivo que se desarrolla en el cuadro 4.16. En 
este caso hay una razón cuasi-F y el resto son razones F. 


CUADRO 4.18 
Razones F para un ANOVA factorial (modelo mixto restrictivo) 
G. libertad Hipótesis nula | Denominador Razón F o cuasi-F 
(a—-1 Hp:0%4=0 AB MCA/MCag 
(b-1 Ho: AB MCg/MCaB 
(c- 1D) Ho: AC+BC-ABC MCc/(MCac + MCsc- MCagc) 
(a- D(b-1) Ho: Residual MCAñB/MCr 
(a- D)(c-1) Ho: ABC MCac!MCaABc 
(b-D(c-D Ho: ABC MC5c!/MCasc 
ABC (a-D(b-D(c-1D | Ho: = Residual MCasc!/MCr 
Residual N-abc 
Total N-1 


4.4.3. La aproximación de Welch-Satterthwaite 


Una última cuestión. Al utilizar una razón cuasi-F' como la de la ecuación 4.17, los grados de liber- 
tad del denominador no son usualmente la suma de los grados de libertad que se corresponden con 
las medias cuadráticas utilizadas, porque puede ocurrir que tal suma sea cero o incluso negativa. Para 
aproximar los grados de libertad para el denominador de una razón cuasi-F es conveniente utilizar la 
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denominada APROXIMACIÓN DE WELCH-SATTERTHWAITE (Satterthwaite, 1946; Welch, 1947) que es una 
función ponderada de las medias cuadráticas utilizadas, y toma una forma típica que depende de los 
términos utilizados para el denominador de la razón cuasi-F. Por ejemplo, la aproximación de Welch- 
Satterthwaite para obtener el número de grados de libertad para el denominador (gl,) de la prueba 
cuasi-F para el efecto de A en el modelo no restrictivo es: 


(MC az + MCac - MCagc)Y? 
MC MCác MCic 
(a-DW=D"la-D(c-D'ta-D=D(c—1) 


gb (A) = (4.21) 


Usando el mismo principio se obtienen las aproximaciones de Satterthwaite para los restantes efectos. 
Así, para obtener los grados de libertad del denominador de la prueba cuasi-F para el efecto de B, 


(MC 18 + MCgc — MCago)? 
gb(B)= E AB S BC ABC > (4.22) 
MC ás MC5c EN MCazc 
(a-D(b-1D)  (b-D(c-D)  (a-1)(b-D(c-1) 
y para el efecto de C, 
(MC ac + MCgc — MCago)y? 
gh (C)= AC BC ABC (4.23) 


MCic MChc MCinc 
(a Dic=D "(=D (a D0=D(—1) 


4.4.4. Un ejemplo con tres factores y efectos mixtos 


Un ejemplo ilustrativo del modelo de efectos mixtos con tres factores es el siguiente experimento hi- 
potético (tomado de Howell, 2013, p. 447, con modificaciones). Se somete a hipótesis la habilidad para 
conducir de dos tipos de conductores, 'inexpertos' y 'expertos' (factor A, conductor), bajo dos condi- 
ciones de conducción, 'de día” y 'de noche' (factor C, condición) en función del tipo de carretera (factor 
B, carretera). Debido a la dificultad de definir efectos fijos para el tipo de carretera, se tomaron al azar 
dos trayectos de un kilómetro cada uno seleccionado de un listado de carreteras de una determinada 
comunidad. El experimento incluyó 4 participantes en cada condición. La variable de respuesta fue el 
número de errores de conducción generados durante el trayecto por un dispositivo de conducción vir- 
tual instalado en el vehículo. Los datos empíricos del ejemplo 4.4 se presentan en el cuadro 4.19. 


CUADRO 4.19 
Datos empíricos del ejemplo 4.4 


Factor C cl c2 
Factor B b1 b2 b3 bl b2 b3 


Factor 4,18,8,10 | 23,15,21,13 | 16,27,23,14 | 21,14,19,26 | 25,33,30,20 | 32,42,46,40 
A 6,4,13,7 2,6,8,12 20,15,8,17 11,17,16,16 | 23,14,13,12 | 17,16,25,12 
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El correspondiente análisis descriptivo, con los estadísticos media, suma, varianza y número de ré- 
plicas (n), se muestra abreviadamente en la salida 4.12. 


SALIDA 4.12 
Análisis descriptivo del ejemplo 4.4 


Variable de respuesta: errores 


SS SSSSAS 


Con esta configuración de dos efectos fijos (A y C) y un factor aleatorio (B), el desarrollo de las es- 
peranzas de las medias cuadráticas y las correspondientes razones F o cuasi-F, tanto para el modelo 
no restrictivo como para el modelo restrictivo, se muestran en el cuadro 4.20 en un formato abreviado 
donde se ha prescindido de símbolos y multiplicadores para representar las medias cuadráticas. Adviér- 
tase que en esta notación abreviada E representa 'Error' en las E(MC) y R representa "Residual' en las 
razones F. Observe que sólo hay una razón cuasi-F en el modelo no restrictivo y ninguna en el modelo 
restrictivo. 


CUADRO 4.20 
Esperanzas y razones F para el ANOVA factorial mixto del ejemplo 4.4 


Modelo no restrictivo Modelo restrictivo 

Efecto E(MC) Razón F o cuasi-F E(MC) Razón F o cuasi-F 
E+ ABC+AB+A A/lAB E+AB+A A/lAB 

E+ ABC+AB+BC+B | BI(AB+AC-ABC) | E+B BIR 

E+ ABC+BC+C BIBC E+BC+A C/IBC 

E+ ABC+AB AB/ABC E+AB ABIR 

E+ ABC+AC AC/ABC E+ABC+AC | ACIABC 

E+ ABC+BC BCIABC E+BC BCIR 

ABC E+ ABC ABCIR E+ ABC ABCIR 

Residual 


El análisis de varianza con el enfoque clásico realizado con el paquete SPSS asumiendo un modelo 
restrictivo (el que por defecto se utiliza en el programa) apunta que se ajusta aceptablemente el modelo 
no aditivo o interactivo, ya que F(2,36) = 3.375; P = .045. Conviene destacar que SPSS y otros paquetes 
estadísticos profesionales únicamente permiten operar con el modelo no restrictivo para obtener las 
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esperanzas de las medias cuadráticas. Hasta donde sabemos, el único programa que permite al usua- 
rio aplicar un análisis de varianza opcionalmente con cualquiera de los dos modelos (restrictivo y no 
restrictivo) es MINITAB. 


SALIDA 4.13 
Tabla ANOVA del modelo III interactivo de segundo orden (enfoque clásico) 


Variable dependiente: errores 

Fuentes SC tipo II MC F 
Modelo 3566.917 324.265 12.675 
A (conductor) 1102.083 1102.083 10.173? 
B (carretera) 816.667 408.333 13.462€ 
C (condición) 1102.083 1102.083 | 132.2504 


AB 216.667 108.333 1.255€ 
AC 140.083 140.083 1.623* 
BC 16.667 8.333 0.0978 
ABC 172.667 86.333 3.3751 
Residual 921.000 25.583 
Total 4487.917 
4MCR PMC(AB) “MC(AB) + MC(BC)- MC(ABC) %MC(BC) * MC(ABC) 


Obsérvese que la salida 4.13 no especifica los grados de libertad del denominador que se emplea 
para probar la razón cuasi-F para el efecto de B. El programa SPSS aplica en este caso la aproximación 
de Welch-Satterthwaite, la opción por defecto. Aunque podría emplear la suma de los grados de libertad 
de las fuentes AB+ BC-— ABC, que es un valor positivo y diferente de cero (en conreto, 24+ 2-2 = 2), se 
emplea sin embargo la aproximación Welch-Satterthwaite dando como resultado 


E (108.333 + 8.333 — 86.333)? _ ss 5% 
81222 = 708.333 ' 8.333? A 86.333? j 


2 2 2 


y el valor de probabilidad apunta que el efecto de B no es estadísticamente significativo: F(2,0.096) = 
13.462; P = .764. Si se hubiera empleado la suma de los grados de libertad del compuesto, el resultado 
habría sido F(2,2) = 13.462; P = 0.069, que casi roza la significación estadística. Sin embargo, el interés 
por este componente es relativo, ya que si se aplica el principio de marginalidad solamente debería in- 
terpretarse la interacción de orden superior (ABC), y no los componentes interactivos de primer orden 
ni los efectos principales. 

Con el enfoque mixto no se plantean estas cuestiones, puesto que los efectos fijos y aleatorios se 
estiman por separado. En este contexto, B es simplemente un efecto aleatorio para el que el programa 
estima directamente un componente de varianza (en concreto, O = 18.750). La salida 4.14 resume los 
resultados para el modelo completo. 

Para valorar el peso de los componentes de varianza, se estiman primero los componentes para los 
efectos fijos, que son: 


$2 =  (1)(1102.083-108.333)/48 = 20.703, 
0, =  (1)(1102.083-—8.333)/48 = 22.786 
dqy =  (1)(140.083-86.333)/48= 1.119 
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y la varianza total resulta entonces igual a 0% = 102.005. En este caso, el efecto del tipo de carretera 
(B) representa un modesto PF = 18.750/102.005 = 0.184 (o sea, algo más de un 18% de la varianza total 
explicada), pero debe también tenerse en cuenta que el componente residual deja sin explicar poco más 
del 25% de la varianza total. 


SALIDA 4.14 
ANOVA de un factor (modelo III) con enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de la varianza 144.170 288.340 (9) 298.340 307.260 
Efectos aleatorios 
Parámetros Estimador E. Típico Zde Wald | P>|Z| 
Varianza o 18.750 26.404 0.710 407 
Varianza Des 7.625 14.173 0.538 .591 
Varianza 0%, 0.000 0.000 
Varianza e 5.438 8.502 0.640 .522 
Varianza a 25.583 6.030 4.243 .000 
Efectos fijos 
Fuentes de variación gl glo F P>F 
A 1 2 10.173 .086 
0 1 4 23.283 .008 
AC 1 4 2.960 .160 


Para calcular la potencia de los efectos del modelo mixto utilizado en este ejemplo es necesario 
proceder independientemente con los efectos fijos y los efectos aleatorios del modelo. Por ejemplo, para 
obtener la potencia del efecto aleatorio ABC hay que consultar la tabla H del anexo de tablas al final del 
texto. Siendo 95 FP, 36) = 3.259, la potencia es es P4gc = .390, un valor muy alejado del valor óptimo 
de potencia. Para obtener la potencia del efecto fijo C, el efecto fijo más relevante, hay que consultar 
la tabla F del anexo de tablas. Siendo el parámetro de no centralidad Ac = (1)(132.250) = 132.250, la 
potencia observada es Pc = .629, que tampoco alcanza el valor óptimo de potencia deseado. 


4.5. SUGERENCIAS DE ESTUDIO 


En cualquier texto avanzado de Estadística o de Diseño Experimental aplicado a las Ciencias del 
Comportamiento y las Ciencias de la Salud podrá encontrar introducciones al procedimiento ANOVA 
con efectos aleatorios. Especialmente apropiados son los textos de Hays (1994), Kutner et al. (2005), 
Maxwell y Delaney (2004), Milliken y Johnson (2009) y Myers et al. (2010). En español recomendamos 
por su orientación al modelado estadístico un manual sobre análisis de datos con efectos aleatorios de 
Palmer y Ato (2013). 

Un tratamiento breve y muy asequible de las ventajas y desventajas de los efectos aleatorios en in- 
vestigaciones psicológicas y educativas es Frederick (1999). Una considerable controversia sobre la di- 
cotomía efecto fijo-efecto aleatorio provocó la publicación de un trabajo de Clark (1973), quien llamó la 
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atención sobre la necesidad de utilizar efectos aleatorios en lugar de efectos fijos para analizar la varia- 
bilidad de participantes y de ítems (véase también Raaijmakers, 2003, y Raaijmakers, Schrijnemakers y 


Gremmen, 1999). 
Tratamientos específicos más avanzados para los modelos ANOVA de efectos aleatorios desde la 


perspectiva del enfoque mixto pueden encontrarse en Sahai y Ojeda (2004-2005) y Searle et al. (2006). 
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5.1. INTRODUCCIÓN 


Uno de los más importantes problemas de los modelos ANOVA que hemos tratado en capítulos ante- 
riores concierne a la alta heterogeneidad que pueden presentar las unidades experimentales selecciona- 
das de una población que reciben un determinado tratamiento o combinación de tratamientos. Cuando 
esto sucede, la varianza de las unidades experimentales para cada tratamiento se infla y la estimación 
de la Media Cuadrática Residual o de Error (MC), que es proporcional a la suma de las varianzas de 
todos los tratamientos, aumenta también de forma desproporcionada. Como consecuencia, cualquier 
razón F que contenga la MCg en su denominador resultará negativamente sesgada, incrementando así 
la probabilidad de error tipo I. 

Si se conoce alguna de las variables causantes de la heterogeneidad de la respuesta puede resultar 
relativamente sencillo reducir la heterogeneidad resultante incluyéndola como variable numérica en el 
contexto de un modelo ANOVA. La combinación de uno (o más) factor/es de tratamiento y una (o más) 
variable/s numérica/s (también llamada VARIABLE CONCOMITANTE, COVARIABLE O COVARIANTE) es el 
escenario del ANÁLISIS DE COVARIANZA (ANCOVA), un procedimiento analítico que combina las ventajas 
del análisis de regresión y del análisis de varianza y resulta especialmente apropiado en aquellos casos 
donde las unidades experimentales son muy heterogéneas. La técnica de control que se utiliza para 
reducir la heterogeneidad se denomina CONTROL ESTADÍSTICO (véase capítulo 6). 

El caso más simple se presenta cuando se dispone de una variable de respuesta, un factor de tra- 
tamiento con dos niveles y una característica numérica de los sujetos (covariante) que se ha registrado 
antes de la medida de la variable de respuesta y que correlaciona con ella. Cuando el diseño es experi- 
mental, es muy probable que las medias de los tratamientos no difieran en la covariante, y por tanto para 
responder a la cuestión de si los tratamientos difieren en la variable de respuesta suele ser irrelevante 
el conocimiento de la covariante. En cambio, cuando el diseño no es experimental, y los tratamientos 
probablemente difieren en la covariante, la cuestión crucial a determinar es si los tratamientos difieren 
en la variable de respuesta como consecuencia de que no son equivalentes en la covariante. 

El ANÁLISIS DE COVARIANZA €s la técnica analítica que subyace a los MODELOS ANCOVA, que son 
desde esta perspectiva modelos ANOVA a los que se ha incorporado una o más variables concomitan- 
tes. Ambos persiguen el mismo objetivo, a saber, evaluar la igualdad de las diferencias entre las medias 
de dos o más grupos, pero la inclusión de covariantes en los modelos ANCOVA aporta tres ventajas im- 
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portantes respecto de los modelos ANOVA (Huitema, 2011, p. 123): 
— Mayor potencia estadística para evaluar el efecto del factor. 


— Potencial reducción del SESGO DE SELECCIÓN, o sea, la no igualdad de los grupos antes de admi- 
nistrar los tratamientos, que suele ser mínima o nula en diseños experimentales, pero importante 
en los diseños cuasiexperimentales y no experimentales. 


— Estimación condicionalmente ajustada del efecto del factor, es decir, una vez depurada o contro- 
lada la influencia de la covariante. 


Los modelos ANCOVA se describen usualmente como procedimientos para reducir la heterogenei- 
dad de las unidades experimentales en un estudio experimental o no experimental. Por esta razón se 
asocian con los DISEÑOS PARA REDUCIR LA VARIANZA DE ERROR, entre los que se encuentran fundamen- 
talmente los DISEÑOS DE BLOQUES ALEATORIOS (DB A) y los DISEÑOS CON VARIABLES CONCOMITANTES 
(DVC). La diferencia esencial entre ambos es que en el primero la covariante adopta la forma de una 
variable categórica mientras que en el segundo la covariante es una variable numérica. 

Se distinguen varios tipos de variables concomitantes o covariantes. Dependiendo de la medida uti- 
lizada, pueden ser medidas de línea base (o sea, medidas pretest realizadas con el mismo instrumento 
de medida de la variable de respuesta), que es el tipo más común, medidas de características organísmi- 
cas (p. ej., edad, inteligencia o nivel de autoestima) y medidas de características ambientales físicas (p. 
ej., nivel de ruido) o sociales (p. ej., densidad de población). 

Pero los modelos ANCOVA no sólo se emplean para reducir la heterogeneidad de las unidades ex- 
perimentales. Es también una metodología para comparar una serie de modelos de regresión, cada uno 
con su propia recta (o plano) de regresión correspondiente a cada uno de los tratamientos o combina- 
ciones de tratamiento planificados por el investigador (véase Milliken y Johnson, 2002). 


5.2. EL MODELO ANCOVA DE UN FACTOR 


Suponiendo un factor de efectos fijos A y una covariante X, con valores X;;, el MODELO ANCOVA 
DE UN FACTOR propiamente dicho se formula mediante un modelo de medias o un modelo de efectos 
mediante: 


Yi 
Yi 


¡+ PX;¡+e;; (5.1) 


p+ a+ BX;¡+ es (5.2) 


donde 4; = 4+ a, una parametrización alternativa y más conveniente computacionalmente. Los pará- 
metros del modelo son: 


— pes una constante fija, 
— fees el coeficiente de regresión para la covariante X;; que es común a todos los tratamientos, 
— q; es un efecto factorial fijo definido como a; = 4; — , donde uu; es la media para el ¡-ésimo 


tratamiento, y 
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— e; es error aleatorio, que se supone con varianza constante y distribuido normal e independien- 
temente: e; - NID(, 0%). 


Puesto que se asume cierto grado de correlación entre la covariante X y la variable de respuesta Y, 
la inclusión de la covariante en el modelo de la ecuación 5.2 puede servir para reducir la varianza de 
error. De hecho, el error e; ¡ del modelo ANOVA (Y; ¡=H4+0j¡+€jj) se considera dividido en un modelo 
ANCOVA en dos porciones independientes, como ya se refleja en la ecuación 5.2, 


ej¡ = PX;¡+ e; j (5.3) 


donde 6 es el coeficiente de regresión que describe la relación de la covariante con la variable de res- 
puesta y e; son los residuales del modelo ANCOVA. 

La conexión entre el modelo ANCOVA y el modelo ANOVA de un factor deriva del hecho de que con 
una simple permutación en la ecuación 5.2 del modelo ANCOVA, en concreto trasladando al primer 
miembro de la ecuación el término PX;;, se obtiene 


Y¡¡—BX¡¡=u+0+€) (5.4) 


Nótese que el segundo miembro de la ecuación 5.4 es en realidad un modelo ANOVA de un factor. Ade- 
más, en la ecuación 5.4 la variable de respuesta ya no es Y;;, sino la diferencia entre la variable de res- 
puesta y el valor esperado de un modelo de regresión simple tomando como predictor la covariante, o 
sea, Y¡¡- PX;;. Y finalmente, se utilizan dos términos de error claramente diferentes: el error e;; del mo- 
delo ANOVA y el error e; del modelo ANCOVA, que será siempre menor que el primero excepto cuando 
la covariante sea irrelevante (es decir, cuando py x =0, y por tanto no haya correlación entre covariante 
y variable de respuesta). Como consecuencia, el modelo ANCOVA de un factor producirá una prueba 
más potente de los efectos de tratamiento a; que el modelo ANOVA de un factor. 

El valor de f en el modelo ANCOVA representa la relación entre la covariante X y la variable de res- 
puesta Y, que se supone igual para todos los tratamientos. El modelo ANCOVA de un factor asume que 
la regresión entre la covariante y la variable de respuesta es la misma para todas las condiciones de tra- 
tamiento del factor A, o sea 6; = f2=...= PB¿= 6, y por tanto se supone una pendiente de regresión co- 
mún para todos los tratamientos. Este supuesto, denominado SUPUESTO DE PENDIENTES DE REGRESIÓN 
HOMOGÉNEAS O también SUPUESTO DE PARALELISMO DE LAS PENDIENTES DE REGRESIÓN, es fundamen- 
tal en este tipo de modelos y su comprobación es un requisito crucial para interpretar adecuadamente 
los resultados. 


5.2.1. Submodelos derivados del modelo ANCOVA de un factor 


Es posible distinguir cinco submodelos derivados del modelo ANCOVA, lo que demuestra que se 
trata de un modelo complejo y más general que el modelo de regresión y que el modelo ANOVA. Se 
representan en la figura 5.1. Suponiendo una covariante Xy un factor A con 3 niveles de tratamiento, los 
cinco submodelos son los siguientes: 


— MODELO NULO (Y;¡=H.+ e;;), donde no hay ni efecto de la covariante ni efecto de tratamiento; 
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— MODELO DE REGRESIÓN (Y;¡= Po + PX;¡ + €; ;), que presupone una misma recta de regresión para 
todos los tratamientos, porque no hay efecto de tratamiento, pero sí efecto de la covariante; 


— MODELO ANOVA (Y;¡= 1+0j¡+€jj), donde hay efecto de tratamiento, pero la recta de regresión 
para cada tratamiento tiene pendiente nula, por cuya razón se denomina también MODELO CON 
PENDIENTES NULAS; 


— MODELO ANCOVA (Y;¡= + BX;¿+ ¡+ e;5), que supone rectas de regresión con constantes (in- 
tercepciones o intersecciones) diferentes pero con una pendiente común para cada nivel de tra- 
tamiento. Se denomina también MODELO ANCOVA CON PENDIENTES PARALELAS U HOMOGÉNEAS. 


— MODELO ANCOVA CON PENDIENTES NO PARALELAS O HETEROGÉNEAS (Y¡¡=p+PX;¡¡+0 ¡+0 ¡PX;¡+ 
e¡;), que también supone líneas de regresión separadas, pero con pendientes diferentes para ca- 
da tratamiento. Puesto que puede a su vez tener constantes iguales o diferentes, este submodelo 
puede adoptar diferentes formas posibles. 


La figura 5.1 muestra un conjunto de seis gráficos que resume las opciones más comunes que pue- 
den presentarse en la investigación aplicada. En cada uno de ellos se representa la función de regresión 
con un predictor numérico (X) y una variable de respuesta (Y) y una o más líneas que representan los 
tratamientos (factor fijo A), que se asumen con tres niveles (al, a2 y a3). 


— En la situación (a) la función de regresión de X sobre Y es nula y, puesto que solamente hay una 
linea, se asume que no hay diferencias entre tratamientos. No son necesarias por tanto ni la co- 
variante X ni el factor A para explicar los datos empíricos. Esta situación corresponde al modelo 
nulo. 


— En la situación (b) la función de regresión no es nula, pero se asume también que no existen di- 
ferencias entre tratamientos. En tal caso, es necesaria la covariante X, pero no se precisa el factor 
para explicar la variable de respuesta. Esta situación corresponde al modelo de regresión. 


— En la situación (c) la función de regresión es nula para los tres tratamientos, por lo que la co- 
variante es innecesaria; sin embargo, se asumen diferencias entre tratamientos. Esta situación 
corresponde al modelo ANOVA. 


— En la situación (d) la función de regresión no es nula y se asumen diferencias entre tratamientos, 
pero las pendientes de regresión se supone que son paralelas. Esta situación es la más apropiada 
para aplicar la técnica del análisis de covarianza. Corresponde al modelo ANCOVA con pendientes 
paralelas. 


— Las situaciones (e) y (f) corresponden a dos de las formas que puede asumir el modelo ANOVA 
con pendientes heterogéneas. La situación (e) se caracteriza por la presencia de una intersección 
común y pendientes diferentes, mientras que la situación (f) refleja diferentes intersecciones y 
diferentes pendientes. 
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(a) (b) 


Figura 5.1. — Submodelos asociados al modelo ANCOVA. 


5.2.2. Supuestos del modelo ANCOVA 


Además de los supuestos típicos del modelo ANOVA (normalidad, homoscedasticidad e indepen- 
dencia), el modelo ANCOVA debe cumplir con un conjunto de supuestos específicos. 

En primer lugar, el SUPUESTO DE LINEALIDAD ENTRE VARIABLE DE RESPUESTA Y COVARIANTE implica 
que la relación existente entre variable de respuesta y covariante tiene forma lineal. Para comprobar que 
este supuesto se satisface, el modelo de regresión deberá ser necesariamente una descripción adecuada 
(aunque con ajuste más pobre que otros modelos más complejos) de los datos, no producirá errores de 
medida ni errores de especificación, ni presentará observaciones extremas. 

En segundo lugar, el SUPUESTO DE INDEPENDENCIA ENTRE COVARIANTE Y TRATAMIENTOS implica que 
la variable explicativa y la covariante no están relacionadas. Es importante evitar que la dependencia se 
presente como consecuencia de no observar la covariante antes de la administración de los tratamien- 
tos, por lo que ésta es una condición más básica que puede comprobarse de forma lógica. Si el supuesto 
de independencia no se satisface pueden producirse sesgos en la estimación de los efectos de tratamien- 
to. Para comprobar este supuesto, usualmente se ajusta un modelo ANOVA tomando las puntuaciones 
de la covariante como variable de respuesta. Si los tratamientos producen resultados estadísticamente 
significativos, el supuesto se considera violado; en caso contrario, el supuesto se cumple. 

En tercer lugar, el SUPUESTO DE HOMOGENEIDAD DE LAS PENDIENTES DE REGRESIÓN implica que las 
pendientes de regresion para cada uno de los tratamientos son aproximadamente iguales. Para com- 
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probar este supuesto se comparan dos submodelos: el submodelo ANCOVA con pendientes paralelas, 
que asume una pendiente común a todos los tratamientos, y el submodelo ANCOVA con pendientes no 
paralelas, que asume pendientes diferentes para cada tratamiento. Si se ajusta el primero, el supuesto se 
satisface; si se ajusta el segundo, el supuesto no se satisface. Muchos autores afirman que la técnica de 
análisis de covarianza sólo es aplicable si se ajusta el primero, pero no es aplicable si se ajusta el segun- 
do. Sin embargo, como veremos más adelante hay procedimientos que permiten interpretar los efectos 
de tratamiento en el modelo ANCOVA con pendientes no paralelas (Milliken y Johnson, 2002). 

Y finalmente, el SUPUESTO DE FIABILIDAD DE LA MEDIDA DE LA COVARIANTE implica que la variable 
concomitante se mida sin error. La violación de este supuesto puede producir sesgos en la estimación 
de las pendientes de regresión para los diferentes tratamientos (Culpepper y Aguinis, 2011a). La com- 
probación de este supuesto no suele realizarse en la práctica, aunque en general se asume la existencia 
de fiabilidad. 

Son dos las ventajas fundamentales que se derivan de la aplicación de un modelo ANCOVA, con 
respecto al modelo ANOVA; a saber: 


— La Suma de Cuadrados no explicada por el modelo (SC) puede reducirse en una magnitud que 
depende de la correlación que exista entre covariante y variable de respuesta. En general, cabe 
afirmar que a mayor correlación, mayor reducción de la SCr. Además de ser un objetivo primario 
del ANCOVA, este hecho es muy importante, porque permite utilizar pruebas estadísticas más 
sensibles para evaluar el efecto de los tratamientos. 


— Además, la Suma de Cuadrados explicada por el modelo (SCm) no sólo puede incrementarse de- 
bido a la correlación entre covariante y variable de respuesta, sino también como consecuencia 
de las diferencias entre los grupos en la covariante. 


5.2.3. El análisis de covarianza 


Ante todo, no debe nunca perderse de vista que la cuestión fundamental que se plantea con el mo- 
delo ANCOVA de un factor es la misma que la del modelo ANOVA de un factor, a saber, la estimación 
de los efectos de tratamiento, pero en el ANCOVA tal estimación se realiza una vez que se ha ajustado el 
efecto de la covariante. 

El modelo ANCOVA de un factor es en muchos aspectos similar al modelo ANOVA de un factor, par- 
ticularmente en términos del objetivo fundamental que se persigue con su utilización, a saber, evaluar 
las diferencias entre las medidas de los niveles del factor. Pero es también un modelo de regresión al que 
se le ha añadido una variable categórica, lo que vuelve a plantear el problema de la colinealidad que en 
condiciones de regularidad no se presentaba en modelos ANOVA. La figura 5.2 (adaptada de Huitema, 
2011, p. 128) presenta la partición de la varianza en los tres modelos. En el modelo de regresión hay dos 
variables implicadas, la variable de respuesta (Y) y la covariante (X) y la partición de la varianza de la va- 
riable de respuesta distingue una porción explicada por la covariante (X) y otra no explicada (Residual). 
En el modelo ANOVA la variable de respuesta se particiona en una porción explicada por el factor (4) y 
otra no explicada por el factor (Residual). En el modelo ANCOVA, la partición de la variable de respuesta 
distingue una porción explicada por el factor (A ajustada), otra porción explicada por la covariante (X 
ajustada) y otra porción no explicada (Residual ajustado). Observe que en el modelo ANCOVA puede 
existir una porción de multicolinealidad que hace preciso el ajuste de los componentes. 
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Figura 5.2. — Partición de la varianza en los modelos de regresión, ANOVA y ANCOVA. 


Los cálculos implicados en el análisis de covarianza son considerablemente más complicados que 
los del análisis de varianza para un factor que tratamos en el capítulo 3. Sin embargo, sigue también 
una lógica similar y por esta razón es relativamente sencillo su desarrollo una vez comprendida la lógica 
subyacente. En cualquier caso, es conveniente seguir una estrategia simple y práctica de modelado que 
permita decidir cuál de los submodelos citados más arriba se ajusta mejor. Una estrategia de modelado, 
propuesta por Milliken y Johnson (2002), se muestra en la figura 5.3, asume que se utiliza SC tipo III y 
codificación tipo regresión para codificar los niveles del factor, y distingue dos etapas: 


— En la primera etapa de modelado se somete a prueba la hipótesis nula de que las pendientes de 
regresión de la covariante sobre la variable de respuesta son nulas, o sea, que no hay efecto de 
la covariante. Si se acepta esta hipótesis, se acepta provisionalmente el submodelo ANOVA y se 
descarta el submodelo ANCOVA en cualquiera de sus dos variantes. Si se rechaza, se acepta provi- 
sionalmente el submodelo de regresión, pero no se descarta alguno de los submodelos ANCOVA. 


En la segunda etapa de modelado se somete a prueba la hipótesis nula de que las pendientes de 
regresión (que se asumen no nulas) son sin embargo paralelas u homogéneas. Si se acepta la hi- 
pótesis se acepta el submodelo ANCOVA con pendientes paralelas u homogéneas y se descarta el 
submodelo ANCOVA con pendientes no paralelas o heterogéneas. En cambio, si se rechaza la hi- 


pótesis, se descarta el submodelo ANCOVA con pendientes paralelas y se considera el submodelo 
ANCOVA con pendientes no paralelas. 


La estrategia de las etapas de modelado propuesta por Milliken y Johnson se puede también realizar 
alternativamente mediante ajuste condicional de modelos, como trataremos más adelante. 
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Figura 5.3.— Estrategia de modelado de Milliken y Johnson (2002). 


5.3. APLICACIÓN DEL MODELO ANCOVA 


Los datos empíricos que utilizamos para ilustrar el procedimiento ANCOVA se presentan en el cua- 
dro 5.1 y proceden de una investigación que comparó tres métodos de entrenamiento (factor método, 
con niveles al, a2 y a3), para mejorar el rendimiento en matemáticas con niños de Primaria. Los ni- 
ños participantes fueron inicialmente asignados al azar a los tratamientos. Los datos del ejemplo sólo 
constituyen un subconjunto de la muestra total, y corresponden a alumnos que asistían a tres aulas de 
centros privados. Todos los centros participantes disponían de puntuaciones en una escala de autoesti- 
ma antes de iniciar el estudio (covariante auto). Al final del mismo, se utilizó una escala de conocimiento 
matemático para evaluar el rendimiento obtenido (variable de respuesta rend). 


CUADRO 5.1 
Datos empíricos del ejemplo 5.1 


método método 


a3 
a3 
a3 
a3 
a3 
a3 
a3 


al 
al 
al 
al 
al 
al 


al 
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5.3.1. Análisis descriptivo 


La salida 5.1 muestra el análisis descriptivo con los promedios y las varianzas de la covariante auto 
y de la variable de respuesta (rend) para cada uno de los niveles del factor método, así como el número 
de réplicas por nivel de tratamiento. Además, para el conjunto (Total) se representa también la matriz 
de SC y PC para las dos variables numéricas (covariante y variable de respuesta). 


SALIDA 5.1 
Análisis descriptivo de los datos del ejemplo 5.1 


Factor Variables Matriz de SCy PC 


método | numéricas | Media Varianza auto rend 


al auto 9.0000 14.0000 
rend 14.0000 13.6667 
al auto 9.0000 23.3333 
rend 12.0000 23.0000 
a3 auto 8.0000 11.0000 
rend 18.0000 18.6667 
auto 8.6667 14.7333 | 294.667 264.667 
rend 14.6667 23.1333 | 264.667 462.667 


Observando los promedios en autoestima y rendimiento para cada uno de los niveles de método, se 
aprecia que estos promedios no presentan una pauta similar, ya que en autoestima método = a2 y méto- 
do= al son los más altos y método = a3 el más bajo, mientras que en rendimiento método = a2 es el más 
bajo y método = a3 es el más alto. Estos promedios dan una idea aproximada de la equivalencia o no 
equivalencia inicial de las aulas donde los niños participantes han recibido cada método. Si se hubiera 
empleado toda la muestra (que se asume asignada al azar), las medias de autoestima serían aproxima- 
damente equivalentes y por tanto su correlación con el método de entrenamiento probablemente sería 
nula. En este ejemplo, los promedios en autoestima son de hecho bastante similares. Al haber empleado 
un subconjunto de casos de la muestra total del estudio, es bastante probable que los tratamientos no 
sean equivalentes al inicio. 

Observe que las varianzas de covariante y variable de respuesta son muy similares en los niveles 
método = al y método = a3, pero ambas difieren sensiblemente del método = a2. Esta es quizá la razón 
fundamental que justifica el empleo de ANCOVA en este ejemplo. El grupo de unidades que reciben a2 
es considerablemente más heterogéneo que el grupo de unidades que reciben al y que el grupo que 
recibe a3. 

El cuadro 5.2 presenta un resumen del procedimiento de cálculo que recomendamos en este texto. 
El procedimiento requiere el ajuste del submodelo ANCOVA con pendientes paralelas y la obtención de 
las cantidades básicas o sumas de cuadrados brutas no corregidas (SCB) que son similares a las que se 
utilizaron en capítulos anteriores. Así, [1] es la corrección media, que requiere un término, [2] es la SCB 
de los valores observados, que requiere N = 21 términos, [4] es la SCB de las medias marginales, que 
requiere a= 3 términos y [3] es la SCB de los valores estimados, que requiere a+ (q-1)=3+(2-1)=4 
términos, donde q se refiere al número de parámetros necesario para obtener los valores estimados. 

Las Sumas de Cuadrados objeto de la descomposición se obtienen a partir de las cantidades bási- 
cas, donde la SC7 = 462.667 representa la suma de los dos componentes esenciales de todo modelo, la 
SCy = 416.681 y la SCz = 45.986. Es importante observar en el cuadro 5.2 que con los modelos ANCOVA 
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se incluye la SC en un apartado que calcula varias sumas de cuadrados residuales para los submode- 
los de regresión, ANOVA y ANCOVA. Así, SCr(Y|4) = 332 es la SC resultante de ajustar un modelo que 
incluye el factor método, pero no la covariante, SCr(Y|X) = 224.946 es la SCp resultante de ajustar el 
modelo que incluye la covariante auto, pero no el factor, y SCr(Y|X, A) = 45.986 es la SC del modelo 
que incluye tanto el factor como la covariante. Por su parte, SCr(Y|X) es la diferencia entre la SC7 del 
modelo ANCOVA y la razón entre el cuadrado de la SP de covariante y respuesta y la SC de la covariante 
(véanse las SC y SP de las variables numéricas del ejemplo 5.1 en la última fila de la salida 5.1). 


CUADRO 5.2 
Descomposición de la variación y cálculo manual del modelo ANCOVA con pendientes paralelas 


Cantidades básicas Procedimiento de cálculo No términos 
a] EYN?IN (308)? /21 =4517.333 1 
[2] e 82+122+...+182+122=4980 | N=21 
[3] Ef 4934.014 a+l1=4 
[A] yA In (98)? /7+84?/7+126?/7=4648 | a=3 

Sumas de cuadrados Procedimiento de cálculo Grados de libertad 
SCT [2] - [1] 4980 — 4517.333 = 462.667 glr=21-1=20 
SCm [3] - [1] 4934.014— 4517.333 = 416.681 g8lu=4-1=3 
SCrR [2] — [3] 4980 — 4934.014 = 45.986 glr=21-4=17 
SCr(Y 14) [2] — [4] 4980 — 4648 = 332 21-3=18 
SCR(YIX) soon - BEreont seen 0 = 224.946 20-1=19 
SCr(Y|X,A) | SCr 45.986 glp=N-p-1=17 

Componentes del modelo Procedimiento de cálculo Grados de libertad 

SCy SCr(Y 14) - SCr(Y|X, A) 332 — 45.986 = 286.014 8ly =18-17=1 
SCr SCr(YIX)-SCR(Y|X,A) | 224.948 — 45.986 = 178.959 8lx: =19-17=2 


Los componentes esenciales del modelo ANCOVA se obtienen a partir de las tres SC residuales de- 
finidas anteriormente. Así, SE, = 178.959 es la SC ajustada del factor, una vez depurada del efecto de 
la covariante, y SC, = 286.014 es la SC ajustada de la covariante, una vez depurada del efecto del fac- 
tor. Este procedimiento de cálculo es en esencia un ajuste condicional de modelos, donde SC”, y SCx 
son el resultado de las diferencias en SC entre dos modelos, un modelo reducido y un modelo aumen- 
tado. Para obtener SEs el modelo reducido es SCr(Y 1/4) y el modelo aumentado es SCr(Y/A, X). Del 
mismo modo, para obtener SC; el modelo reducido es SCr(Y|X) y el modelo aumentado es de nuevo 
SCr(Y 14, X). Todas estas cantidades se han calculado en el cuadro 5.2. 

La figura 5.4 se obtuvo realizando sendos análisis de regresión de la covariante sobre la variable de 
respuesta para cada uno de los niveles del factor. Observe que cada una de las rectas de regresión tienen 
intercepciones diferentes (en particular, 43), pero las pendientes de regresión siguen una clara pauta de 
paralelismo, o sea, cupliendo el patrón (d) de la figura 5.1. 

Los dos submodelos básicos sobre los que descansa el análisis de covarianza son el submodelo de 
regresión, que se propone para probar si hay un efecto de la covariante independientemente del factor 
(véase salida 5.2a, para los estimadores de los parámetros y salida 5.2b, para la descomposición de la va- 
rianza) y el submodelo ANOVA, que se propone para analizar el efecto del factor independientemente de 
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la covariante (salida 5.3). Con respecto al primero, puede concluirse que hay un efecto de la covariante, 
Fx (1,19) = 20.079; P < .001. Con respecto al segundo, se observa un efecto marginalmente significativo 
del factor: FA4(2, 18) = 3.542; P = .05. Sin embargo, en un análisis post-hoc de comparaciones entre pares 
de medias, ninguna de las comparaciones entre medias de grupo arrojaron diferencias significativas. 


al a2 a3 
25- 
nm 
20- A 
0 n 
c s metodo 
3 O al 
5 J a A 22 
a 
E 15- A 
hd Mm a3 
A 
| 
10- 
0) 
I 1 I 1 I I I I I 
5 10 15 5 10 15 5 10 15 
auto 


Figura 5.4. — Análisis de regresión de auto sobre rend para cada nivel de método 


SALIDA 5.2a 
Estimación de parámetros del submodelo de regresión 


Variable dependiente: rend 


Límites IC 95% 


Parámetro 


Inferior 


Superior 


Constante 


auto 
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SALIDA 5.2b 


Ajuste del submodelo de regresión 


Variable dependiente: rend 


Fuentes 


SC tipo III 


MC 


Modelo 


auto 


Residual 


237.721 
237.721 
224.946 


237.721 
237.721 
11.839 


Total 


Fuentes 


462.667 


SALIDA 5.3 


Ajuste del submodelo ANOVA 


Variable dependiente: rend 


SC tipo III 


Modelo 


método 


Residual 


130.667 
130.667 
332.000 


Total 


462.667 


5.3.2. Análisis de covarianza mediante las etapas de modelado 


En la primera etapa de la estrategia de modelado de Milliken y Johnson se prueba la hipótesis de 
pendientes nulas. En cierta medida, la hipótesis nula puede considerarse rechazada porque el submo- 
delo de regresión fue significativo (salida 5.2b). Sin embargo, el submodelo de regresión se ha estimado 
sin tener en cuenta el efecto del factor. La forma correcta de probar esta hipótesis debe emplear un mo- 
delo que incluya el factor y la interacción entre factor y covariante, pero no incluyendo la intercepción 
para facilitar la interpretación de los estimadores de los parámetros. Las salidas 5.4a (para los estimado- 
res de los parámetros) y 5.4b (para la descomposición de varianza) presentan los resultados del ajuste 
del modelo. En la salida 5.4a, los tres primeros estimadores son las constantes o intercepciones y los 
tres siguientes son las pendientes de las rectas de regresión de la figura 5.4. La decisión sobre si las pen- 
dientes son nulas depende de la significación del efecto de interacción metodox auto de la salida 5.4b. 
Puesto que F(3, 15) = 31.415; P <.001, se concluye que las pendientes de regresión no son nulas. 


Parámetro 


SALIDA 5.4a 
Estimación de parámetros del modelo para hipótesis de pendientes nulas 


Límites IC 95% 


Inferior 


Superior 


metodo=1 
método=2 
método=3 
método=1 x auto 
método=2 x auto 


método=3 x auto 


1.412 
0.037 
5.596 
0.559 
0.665 
0.603 


9.231 
6.349 
13.434 
1.370 
1.293 
1.518 
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SALIDA 5.4b 
Ajuste del modelo hipótesis pendientes nulas 
Variable dependiente: rend 
Fuentes SC tipo III MC F 
Modelo 4934.414 822.402 | 279.609 
método 121.087 40.362 13.281 


método x auto 286.414 95.471 31.415 
Residual 45.586 3.039 
Total 4980.000 


En la segunda etapa se pretende probar si las pendientes de regresión son paralelas u homogéneas. 
El submodelo que se utiliza en esta etapa es el submodelo ANCOVA con pendientes no paralelas o he- 
terogéneas (véase figura 5.3). La salida 5.5 presenta la descomposición de la varianza del modelo AN- 
COVA con pendientes no paralelas (la salida de estimadores de los parámetros no es necesaria). Todo 
el interés se centra en la significación de la interacción métodox auto: si es significativa, se acepta el 
submodelo ANCOVA con pendientes no paralelas; si no es significativa, se acepta el submodelo ANCO- 
VA con pendientes paralelas. Puesto que F(2, 15) = 0.066, P = .937, se selecciona el submodelo ANCOVA 
con pendientes paralelas. 


SALIDA 5.5 
Ajuste del submodelo ANCOVA con pendientes no paralelas 
Variable dependiente: comp 
Fuentes SC tipo II MC 
Modelo 416.681 138.893 
método 21.878 2 10.939 
auto 286.014 286.014 


método x auto 0.400 2 0.200 
Residual 45.586 3.039 
Total 462.667 


Es importante precisar que hemos utilizado en la salida codificación tipo ANOVA para codificar el 
factor y SC tipo Il, en lugar de SC tipo III (que son las más usuales en las salidas de muchos paquetes 
estadísticos), porque las SC tipo III no preservan el principio de marginalidad en modelos ANCOVA y 
prueban los efectos principales de la covariante (y del factor) en modelos que incluyen interacciones. Si 
se desea aplicar el principio de marginalidad parece más coherente ajustar la interacción únicamente 
cuando se han estimado los efectos principales del factor y de la covariante. 

El modelo finalmente seleccionado es el modelo ANCOVA con pendientes paralelas. Este modelo se 
ha ajustado en las salidas 5.6a y 5.6b y es estadísticamente significativo: Fm(3, 17) = 51.346; P < .001. 


SALIDA 5.6a 
Estimación de parámetros del modelo ANCOVA con pendientes paralelas 


Variable dependiente: rend 

Límites IC 95% 
Parámetro Inferior | Superior | Tolerancia 
Constante . 7.963 12,147 


método=al A 6.859 -3.127 0.741 
método=a2 y 8.859 -5.127 0.741 
auto ; 0.789 1.197 0.984 
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SALIDA 5.6b 
Ajuste del submodelo ANCOVA con pendientes paralelas 


Variable dependiente: rend 

Fuentes | SC tipoTII MC F 

Modelo 416.680 3 | 138.893 51.346 
metodo 178.959 2 89.480 33.079 


auto 286.014 1 286.014 105.732 
Residual 45.986 2.705 
Total 462.667 


Obsérvese en la salida 5.6b que el efecto del factor método, una vez que ha sido ajustado del efec- 
to de la covariante auto, es significativo: F4(2,17) = 33.079;P = .000. Y aunque no es esencial la in- 
terpretación de la covariante, se puede también concluir que la covariante es también significativa: 
F(1,17) = 105.732; P = .000. 

Un inconveniente con el que hay que lidiar es el problema de la multicolinealidad, que suele ocu- 
rrir cuando se emplean variables numéricas en modelos de regresión o en modelos ANCOVA con SC 
tipo III. Obsérvese que la suma de los dos componentes del modelo de la salida 5.6b (SC4 + SCx = 
286.014 + 178.959 = 464.973) no es igual al modelo (SCy = 416.681). Afortunadamente, los valores de 
tolerancia que se muestran en la salida 5.6a se alejan del límite (TOL > 0.10) y por tanto no suponen 
ningún problema grave. Es también importante apuntar que los promedios en rendimiento para cada 
nivel de método (o sea, las medias Y; = 14, Y, =12e Y; = 18) se consideran en este contexto MEDIAS 
DE TRATAMIENTO NO AJUSTADAS, o sea, no depuradas de su correlación con la covariante. 


5.3.3. Análisis de covarianza mediante ajuste condicional 


Hay una correspondencia directa entre el procedimiento de las etapas de modelado y el procedi- 
miento de ajuste condicional. Los dos modelos que se someten a prueba en el ajuste condicional para 
probar la hipótesis de pendientes nulas son el Modelo 1 (modelo reducido), que incluye sólo el factor 
método, y el Modelo 2 (modelo aumentado), que incluye el factor y la interacción entre factor y cova- 
riante (pero no la covariante). El componente diferencial es la interacción entre factor y covariante, pero 
no se incluye la covariante, y el objeto es determinar la nulidad de las pendientes de regresión de la co- 
variante para cada nivel del factor. El resultado del ajuste condicional es: F(3,15) = 31.415;P < .001 y 
por tanto se selecciona el modelo más complejo (o sea, el modelo con interacción) y se concluye que las 
pendientes de regresión no son nulas. 


SALIDA 5.7 
Ajuste condicional para probar si las pendientes son nulas 


Modelo 1: rend = método 
Modelo 2: comp = método + método x auto 


Modelo SCr ASCR 


332.000 
45.586 286.414 


Los dos modelos que se emplean para probar si las pendientes son paralelas u homogéneas son el 
Modelo 3 (modelo reducido), que incluye factor y covariante, y el Modelo 4 (modelo aumentado), que 
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incluye factor, covariante e interacción entre factor y covariante. El componente diferencial es también 
la interacción, pero en este contexto se incluye la covariante y por tanto el objeto es determinar si las 
pendientes de regresión de la covariante para cada nivel del factor son homogéneas. El resultado del 
ajuste condicional es: F(2, 15) = 0.066; P = .937, que conduce a la selección del modelo más simple y a 
concluir que las pendientes son paralelas u homogéneas. El modelo final seleccionado es por tanto el 
modelo ANCOVA con pendientes homogéneas. 


SALIDA 5.8 
Ajuste condicional para probar si las pendientes son paralelas 


Modelo 3: rend = método + auto 


Modelo 4: comp = método + auto + método x auto 


La comparación de la prueba del factor Fx de la salida 5.3 (submodelo ANOVA) y la prueba del 
factor Fa de la salida 5.6b (Modelo ANCOVA con pendientes paralelas) nos da las claves interpreta- 
tivas de la mejora conseguida con este procedimiento analítico. Sin tener en cuenta la covariante, el 
efecto del factor método fue marginalmente significativo: F(2;18) = 3.54; P = .050 (salida 5.3). Después 
de introducir la covariante, el efecto del factor método obtuvo un resultado claramente significativo: 
F(2;17) = 33.08; P < .001 (salida 5.6b). 


5.3.4. Comparaciones entre medias del factor ajustadas 


El análisis de covarianza asume que las pendientes de regresión para cada nivel de tratamiento son 
homogéneas dentro de un margen de probabilidad establecido, como hemos probado anteriormente, 
y por tanto se requiere alguna forma de ponderación de las pendientes de regresión de la covariante 
sobre la variable de respuesta para obtener una pendiente común. Puede resultar útil distinguir entre 
la pendiente de regresión de la covariante sobre la variable de respuesta, sin tener en cuenta el factor, 
br = 0.898, que se muestra en la salida 5.2a y se denomina en este contexto COEFICIENTE BETA TOTAL, y 
la pendiente de regresión de la covariante sobre la variable de respuesta, una vez ajustada del efecto del 
factor, que es bz = 0.993, que se muestra en la salida 5.6a, y se denomina COEFICIENTE BETA RESIDUAL. 

El coeficiente bg se emplea en este contexto para calcular las MEDIAS DE TRATAMIENTO AJUSTADAS 
del efecto de la covariante. En la salida 5.1 pueden consultarse las medias de tratamiento no ajustadas 
(Y =14, Y, =12y Ya = 18), que se obtuvieron sin tener en cuenta la covariante. Teniendo en cuenta 
la covariante, y situándola en su valor medio GO), la ecuación para obtener las correspondientes medias 
ajustadas utiliza la ecuación siguiente: 


Y =Y¡-br(X¡-X) (5.5) 


donde Y ¡ es la media de la variable de respuesta en el ¡-ésimo nivel de tratamiento (véase salida 5.1), 
bp es el coeficiente beta residual, que se refiere a la pendiente de regresión común (bx = .993), XxX ¡es 
la media de la covariante para el ¡-ésimo nivel de tratamiento y X es la media global de la covariante 
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(consulte la salida 5.1). Aplicando la ecuación 5.5 obtenemos Y, = 14 — (.993)(9 — 8.667) = 13.669, Ya = 
12 — (.993)(9 — 8.667) = 11.669, e Ya = 18 — (.993) (8 — 8.667) = 18.662. 

Obsérvese también que las medias de tratamiento ajustadas difieren moderadamente de las medias 
de tratamiento no ajustadas. Conviene resaltar que el cálculo de las medias ajustadas de la variable de 
respuesta se obtuvo para un valor único de la covariante, y en concreto, su media. Obviamente, si las 
pendientes se asumen paralelas, las mismas diferencias se mantienen sea cual sea el valor que tome 
la covariante. Esto supuesto, es claro que el efecto del factor método ha resultado potenciado tras el 
ajuste producido por la covariante X, puesto que la amplitud de las medias ajustadas (rango efectivo 
de 11.669 a 18.662) es mayor que la amplitud de las medias no ajustadas (rango efectivo de 12 a 18). 
La salida 5.9 presenta las medias de tratamiento ajustadas del efecto de la covariante (calculadas para 
su valor medio), junto con los errores típicos y los correspondientes intervalos de confianza. La sali- 
da 5.10 muestra las comparaciones por pares entre medias de tratamiento ajustadas con el método de 
Bonferroni. Obsérvese que todas las diferencias entre medias del factor ajustadas fueron estadística- 
mente significativas, con excepción de la diferencia al — a2. A título comparativo, como se apuntó más 
arriba, en el submodelo ANOVA ninguna de las posibles diferencias entre las medias del factor resultó 
estadísticamente significativa. 


SALIDA 5.9 
Medias ajustadas e intervalos de confianza 


Variable dependiente: rend 


Factor Medias Error IC al 95% 

metodo | ajustadas | típico | Inferior | Superior 
13.669 0.622 12-356 14.982 
11.669 0.622 10.356 12.982 
18.662 0.625 17.344 19.981 


SALIDA 5.10 
Comparaciones por pares entre medias ajustadas con el método de Tukey 


Variable dependiente: rend 
Tukey Diferencia IC al95% 

metodo (j) | metodo (j') | de medias Inferior | Superior 

al a2 2.000 ; -0,334 4.334 
a3 4.993 ; 7.341 2.645 
a2 al 2.000 ; 4.334 0.334 
a3 6.993 x 9.341 4.645 
a3 al 4.993 y 2.645 7.341 
a2 6.993 j 4.645 9.341 


5.3.5. Magnitud del efecto en modelos ANCOVA 


Las SC ajustadas se utilizan también para calcular índices de magnitud del efecto en modelos ANCO- 
VA. El índice más empleado con ANCOVA es 1?, que para el ejemplo 5.1 es Y = 178.959/462.667 = 0.387. 
El paquete SPSS reporta por defecto eta cuadrado parcial 07) que es la razón entre la SC”, y la suma de 
SCr y SCp, o sea, ía = 178.959/(178.959 + 45.986) = 0.796. 
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Recuérdese que los índices de magnitud del efecto para el factor A 07 y 0) son valores sesgados por 
el tamaño muestral, y el segundo produce proporciones de varianza explicada que no suman la unidad. 
Un índice menos sesgado por el tamaño muestral es Wa de Hays. La fórmula clásica de cálculo es: 


SC, (gl (MC) 


A2_ 
47" SOL EMO 


(5.6) 


donde SC; = 178.959 es la SC ajustada del factor, MC = 2.705 es la estimación de la varianza de error 
del modelo ANCOVA con pendientes paralelas y SC, es la suma de todas las SC de los efectos del mo- 
delo: SC, = 178.959 + 286.014 + 45.986 = 510.959. Nótese también que la SC», difiere de SC7 = 462.667 
del modelo ANCOVA como consecuencia de la multicolinealidad. 

Una fórmula de cálculo que utiliza las razones F y es muy útil para estimar w? es: 


l,(Fa-1 
RE 2 A alFa=U (5.7) 
gla(Fa-D+glx(Fx-D+N 


donde gla y Fa son los grados de libertad y la razón F para el efecto del factor, y glx y Fx son los 
grados de libertad y la razón F para el efecto de la covariante. Para el modelo ANCOVA con pendientes 
paralelas, 0 = 0.338. Un procedimiento más costoso, pero más intuitivo, para obtener omega cuadrada 
utiliza los componentes de la varianza. Siendo A = 8.2665, $2 = 13.492 y o? = 2.705, la varianza total es 
ds = 24.463, y el índice omega cuadrado es también 0 = 8.2665/24.463 = 0.338, apuntando que más 
de la tercera parte de la varianza de rend está explicada por el factor método. 

La normativa APA recomienda que un informe científico incluya la razón F empírica y algún índice 
de magnitud del efecto. Para este ejemplo, la información que recomendamos reportar sobre el resulta- 
do obtenido para el factor método con un modelo ANCOVA asumiendo pendientes paralelas podría ser: 
F(2,17) = 33.079; P < .001,60* = 0.338. 


5.4. ANCOVA CON PENDIENTES NO PARALELAS 


Cuando no se cumple el supuesto de homogeneidad de las pendientes de regresión, el submodelo 
ANCOVA con pendientes paralelas no es apropiado, porque la magnitud del efecto del factor no es el 
mismo en todos los niveles de la covariante y las medias ajustadas en la variable de respuesta, calculadas 
para el valor medio de la covariante, no serían las mismas para otros valores posibles de la covariante. 
Asumiendo la existencia de dos grupos, Huitema (2011, p. 249) considera tres posibles escenarios en que 
la violación del supuesto de paralelismo de las pendientes puede producirse. Se representan en la figura 
5.5. En el primero (A), las medias ajustadas en la variable de respuesta son iguales en el valor medio 
de la covariante, pero el grupo 1 supera al grupo 2 con bajos valores de la covariante, mientras que el 
grupo 2 supera al grupo 1 con altos valores de la covariante, sugiriendo una interacción no ordinal. Si el 
supuesto de paralelismo de las pendientes no se comprobara, el investigador concluiría que no existen 
efectos de tratamiento, cuando de hecho sí existen. En el segundo (B), las medias ajustadas difieren en 
el valor medio de la covariante, pero llegan a ser iguales con valores más bajos de la covariante y difieren 
con valores más altos, sugiriendo una interacción no ordinal. En el tercero (C), el más común, las medias 
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ajustadas también difieren en el valor medio de la covariante, pero las diferencias se reducen con valores 
más bajos de la covariante y se amplían con valores más altos, apuntando una interacción no ordinal. 


Xx 


Figura 5.5. — Tres escenarios del submodelo ANCOVA con pendientes no paralelas 


En consecuencia, cuando no se cumple el supuesto de paralelismo de las pendientes de regresión 
es preciso considerar el submodelo ANCOVA con pendientes no paralelas. La diferencia que plantea 
este submodelo respecto del submodelo ANCOVA con pendientes paralelas es que, mientras que en 
éste las diferencias entre las medias ajustadas se calculan para el valor medio de la covariante y por 
tanto se asumen constantes en todo el rango de valores de aquélla, en el submodelo con pendientes no 
paralelas se requiere determinar un rango de valores de la covariante donde las medias ajustadas tengan 
diferencias significativas (región de significación) y otro rango de valores donde las medias ajustadas no 
tengan diferencias significativas (región de no significación). 

En investigación aplicada se manejan dos formas alternativas de obtener tales regiones de significa- 
ción. La TÉCNICA DE JOHNSON-NEYMAN, que fue propuesta por sus autores en 1936, es la más completa 
porque determina directamente las regiones de significación y no significación. La TÉCNICA DE SELEC- 
CIÓN DE PUNTOS fue propuesta por Rogosa (1980) y determina para un valor concreto de la covariante si 
la diferencia es o no significativa. Aunque en la práctica suele bastar con emplear un limitado número 
de puntos, la aplicación de este último procedimiento requiere repetir con muchos puntos posibles el 
mismo proceso, por cuya razón trataremos aquí el primer procedimiento. 

El concepto que subyace a ambas técnicas es similar al que se plantea con la interacción en modelos 
ANOVA con dos factores. La interacción en estos modelos se prueba calculando los efectos simples de 
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un factor para cada uno de los niveles del otro. La novedad en los modelos ANCOVA con pendientes 
no paralelas es que en lugar de un factor con un número limitado de niveles se utiliza una variable 
numérica para caracterizar la interacción entre tratamiento y covariante. 

Para ilustrar la técnica de Johnson-Neyman (JN), utilizaremos un nuevo conjunto de datos (ejemplo 
5.2), que se exhiben en el cuadro 5.3. Incluye las variables motivación para el aprendizaje (variable de 
respuesta moti), ansiedad (covariante ansi) y un factor de grupo de tratamiento (factor grupo) con 2 
niveles. El propósito del investigador en este ejemplo fue introducir en el modelo la covariante ansiedad 
para hacer más sensible el efecto del tratamiento. 

Aunque aquí se emplea para dos grupos, una covariante y un factor, el procedimiento puede no obs- 
tante generalizarse a más de dos grupos, dos o más covariantes y dos o más factores. Versiones robustas 
de ambas técnicas pueden consultarse en Huitema (2011, capítulo 11). 


CUADRO 5.3 
Datos empíricos del ejemplo 5.2 


1 
2 
3 
4 
5 
6 
7 
8 
9 
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El análisis descriptivo se resume en la salida 5.10. Se ha prescindido de gran parte del procedimiento 
de cálculo recomendado para el submodelo ANCOVA y solamente se incluyen las cantidades básicas que 
son necesarias para el cálculo de las regiones de significación. Las cantidades de interés son las medias 
y varianzas de la covariante para cada nivel del factor (recuérdese que la SC corregida es el resultado 
de multiplicar la varianza de cada grupo por sus grados de libertad) y los coeficientes de regresión que 
resultan de ajustar sendos modelos de regresión simple con la covariante como predictor para cada uno 
de los niveles del factor. 


SALIDA 5.10 
Análisis descriptivo datos ejemplo 5.1 


Factor Coeficientes 


grupo — Covariante SC corregida bo bi] 
al ansi 374.9333 30.458 | —1.200 
al ansi 374.0000 0.129 1.107 
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En primer lugar, asumiendo que se ha probado que las pendientes no son nulas ni paralelas u ho- 
mogéneas, el investigador ajusta el submodelo ANCOVA con pendientes no paralelas. La salida 5.11 
muestra los resultados del ajuste en el que hemos empleado SC tipo II, en lugar de SC tipo III, que es la 
SC que ofrecen por defecto los paquetes estadísticos al uso, porque las SC tipo II preservan el principio 
de marginalidad en presencia de interacción, mientras que las SC tipo III no lo preservan. Por otra parte, 
las pruebas f para los coeficientes de regresión parcial métricos son, desde un punto de vista inferen- 
cial, similares a las razones F del modelo ANCOVA con SC tipo III, por lo que la información de ambas 
salidas se complementa. 

El informe de resultados del investigador apuntaría en principio la existencia de una interacción es- 
tadísticamente significativa: F(1,26) = 194.377; P < .001 y la conclusión de que se ajusta el submodelo 
ANCOVA con pendientes no paralelas. La cuestión clave en este contexto es si la interacción es signifi- 
cativa en todo el rango de valores de la covariante. 


SALIDA 5.11 
Ajuste del submodelo ANCOVA con pendientes no paralelas y SC tipo II 


Variable dependiente: moti 

Fuentes SC tipo II MC F 
Modelo 1022.834 340.945 66.487 
ansi 1.737 1.737 0.339 
grupo 778.841 558.841 | 151.875 


ansi x grupo 996.797 996.797 | 194.377 
Residual 133.333 5.128 
Total 1156.167 


Para encontrar las regiones de significación y no significación con la técnica de Johnson-Neyman 
deben obtenerse las siguientes cantidades básicas a partir de la salida 5.11: 


2Fa,a,N-4 ! 1 2 
A = -—==(SC + + (b b 5.8 
N-4 (SCp) Sea SC (b11 — b12) (5.8) 
rar la X2 
B —_ SC + + (b bo2)(b11 -b 5.9 
N-4 ( ES ES (bo1 — bo2)(b11 — b12) (5.9) 
> 2 
2Fa,a.N-4 ] N X; X> 2 
C = -—=(SC + + (b b 5.10 
N-4 ( AE SE SC (bo1 — bo2) (5.10) 


donde Fa, g1, +1,g1, €s el valor crítico de significación al nivel a con a= 2 (0 sea, el número de niveles del 
factor) y N—4= 26 grados de libertad, SC; es la SC residual del submodelo ANCOVA con pendientes 
no paralelas (véase salida 5.11), y las restantes cantidades pueden consultarse en la salida 5.10. Con un 
nivel de significación del 5%, el valor crítico es Fo5,2,26 = 3.369, y las cantidades básicas resultantes son: 


2 x 3.369 1 1 5 
A = -=—(133.333) + + (-1.200- 1.107)? = 5.138 
374.933 374 
2 x 3.369 12.933 15 
B = —(133.333)| -— + + | + (30.458— 0.129)(-1.200-— 1.107) = -67.391 
374.933 — 374 
2 x 3.369 30 —.12983%...15* 3 
C = -=—-(133.333) + —— | + (30.458 — 0.129)? = 879.039 
15*15 374.933 374 
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y finalmente se aplica una función cuadrática para encontrar las dos regiones de significación, 


X= -B+vB?*- AC _ 67.39+ (67.39)? — (5.14)(89.04) 


= (12.137, 14.097; (5.11) 
A 5.14 


donde X es un intervalo que marca la región de no significación, siendo X, = 12.137 el valor límite 
inferior y Xs = 14.097 el valor límite superior del intervalo. 

La figura 5.6 funde el efecto interactivo de la covariante ansi con el factor grupo, donde se han mar- 
cado con líneas verticales tanto el valor inferior (X, = 12.137) como el valor superior Xs = 14.097 del 
intervalo, dejando dos regiones de significación: la que está dentro del intervalo es la región de no signi- 
ficación y la que está fuera del intervalo (a la izquierda y a la derecha) es la región de significación. 


A 


límite inferior=12.14 límite superior=14.10 


grupo 
../0 
A 1 


Figura 5.6. — Regiones de significación del submodelo ANCOVA con pendientes no paralelas 


Recuérdese que el objeto de la aplicación de la técnica era detectar regiones donde las diferencias 
entre grupos en función de la covariante fueran significativas y donde no lo fueran. En consecuencia, 
puede concluirse que para individuos con valores en la covariante ansiedad comprendida entre los lí- 
mites X; = 12.137 y Xs = 14.097, las diferencias entre grupos no fueron significativas. Sin embargo, para 
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individuos con valores en la covariante ansiedad superiores a 14.097 o inferiores a 12.137, las diferencias 
entre grupos fueron estadísticamente significativas. Por consiguiente, podemos concluir que cuando la 
puntuación de los sujetos en la variable ansiedad se encuentra entre 12.14 y 14.10 es indistinto aplicar el 
tratamiento al o el tratamiento a2. Sin embargo, por debajo de 12.14 sería mejor aplicar el tratamiento 
al para los sujetos con bajas tasas de ansiedad y el tratamiento a2 para los sujetos con tasas altas de 
ansiedad. 


5.5. ANCOVA CON DOS COVARIANTES 


El modelo ANCOVA con un factor de tratamiento y una covariante es el caso más simple de los mo- 
delos que utilizan análisis de covarianza. Puede extenderse con facilidad a casos más complejos, que 
contemplan la inclusión de más de un factor de tratamiento y/o dos o más covariantes siguiendo la 
misma lógica del modelo ANCOVA simple. En la práctica, puede definirse una amplia variedad de mo- 
delos ANCOVA para cada uno de los diseños que trataremos en los capítulos siguientes, lo que convierte 
al modelo ANCOVA en uno de los instrumentos más versátiles de la investigación aplicada. Sin embargo, 
también conviene advertir que el modelo ANCOVA es un instrumento que debe ser aplicado con suma 
precaución, y en circunstancias especiales puede plantear serios problemas de interpretación (Elashoff, 
1969) e incluso facilitar una interpretación errónea de los resultados (Ato y López, 1992). Para estos casos 
especiales recomendamos que su aplicación sea supervisada por un experto en análisis de datos. 

El ejemplo 5.3 utiliza dos covariantes (X1 y X2), y un factor de tratamiento (4), con dos niveles, al y 
a2, para explicar una variable de respuesta (Y) e implica regresión múltiple en lugar de regresión simple 
como en el ejemplo 5.1. Los datos se han tomado del texto de Winer, Brown y Michels (1991, p. 794) y se 
reproducen en el cuadro 5.5. 


CUADRO 5.5 
Datos empíricos del ejemplo 5.3 
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El análisis descriptivo se muestra en la salida 5.12. Obsérvese que se utiliza el mismo formato de la 
salida 5.1, que incluye medias, sumas y varianzas para cada nivel de factor y covariante y una matriz de 
SC y PC para el conjunto (Total). 
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SALIDA 5.12 
Análisis descriptivo datos ejemplo 5.3 


Factor | Variables Matriz de SC y PC 


A numéricas Varianza X1 X2 Y 


al 3.902 
4.932 
62.091 
2.788 
2.091 
58.447 
3.201 73.625  —28.375 53.875 
3.375 | -28.375 77.625 253.875 
61.650 53.875 253.879  1417.958 


En primer lugar, es de interés para el investigador constatar cuál sería el efecto del tratamiento si se 
prescindiera de las covariantes X1 y X2, o sea, ajustando un modelo ANOVA de un factor. El correspon- 
diente ANOVA (no mostrado) apuntaría que el efecto del factor A no es estadísticamente significativo: 
F(1,22) = 1.527; P =.230. 

Puesto que ha recogido información acerca de las covariantes X1 y X2, el investigador decide in- 
troducirlas en el modelo con el objeto de reducir la heterogeneidad de las unidades utilizando modelos 
ANCOVA y aplicando cualquiera de los dos procedimientos que se desarrollaron en la sección anterior, 
o bien la estrategia de modelado en dos etapas o bien el enfoque de la comparación de modelos. La 
conclusión es la misma con cualquiera de las dos estrategias. Mostraremos los detalles de la aplicación 
utilizando el ejemplo 5.3 con el procedimiento de comparación de modelos. 

Para probar la hipótesis de pendientes nulas se definen los dos modelos siguientes: un modelo sin 
intersección que combina el efecto del factor A y su interacción con X1 y X2 (Modelo 2, o modelo au- 
mentado): Y;¡=4¡+(06) ¡1 X51 +(0: 6) ¡2 Xi2+ ej y el mismo modelo del que se excluyen los componen- 
tes de interacción (Modelo 1 o modelo restringido): Y;¡= «¡+ ej El proceso de comparación de los dos 
modelos se realizó con el programa R, se resume en la salida 5.13 y permite concluir que ambos mode- 
los difieren estadísticamente: F(4, 18) = 30.216; P < .001, y por tanto se acepta el modelo más complejo. 
Nótese el símbolo (-1) para denotar la exclusión de la intersección en ambos modelos y la notación (:) 
para denotar una interacción, que son típicas del programa R. 


SALIDA 5.13 
Ajuste condicional de los modelos 1 y 2 
Modelo 1: Y =-1+ A 
Modelo 2: Y =-1+ 4+ 4: X1+ A: X2 
Modelo SCr ASCR 


1325.917 
171.868 1154.048 


Para probar la hipótesis de pendientes homogéneas se formulan también dos modelos: el modelo 
ANCOVA con pendientes no paralelas (Modelo 4, o modelo aumentado): Y;¿= + 4j¡+ P1Xi1 + P2X¡2 + 
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(a6) ¡1 Xi1 + (06) ¡2 Xj2 + ej y el mismo modelo del que se han excluido los componentes de interacción 
Ax X1l y Ax X2 (Modelo 3, o modelo restringido): Y;¡ =p +aj+P1X51 + PB2X¡2+ e; El proceso de com- 
paración de estos dos modelos se resume en la salida 5.14, permitiendo constatar que los dos modelos 
no difieren significativamente, por lo que se acepta el modelo más simple, o sea, el modelo ANCOVA 
con pendientes homogéneas: F(2,18) = 0.966; P =.399. 


SALIDA 5.14 
Ajuste condicional de los modelos 3 y 4 
Modelo 3: Y=1 + 4+ X1+X2 
Modelo 4: Y=1 + 4+ X1+X2+A4:X1+4:X2 
Modelo SCr 
3 190.317 


4 171.868 


En el ejemplo 5.3 las dos covariantes (X1 y X2) han supuesto una contribución importante para 
reducir la heterogeneidad de las unidades experimentales. Uno de los resultados que podría haberse 
producido es que solamente una de las dos covariantes fuera significativa. En tal caso, tanto la estrategia 
de modelado como la comparación de modelos procederían eliminando la covariante no significativa y 
la situación final resultante sería la misma que para el ejemplo 5.1. 

El modelo final seleccionado es por tanto el submodelo ANCOVA con pendientes homogéneas, que 
emplea pendientes comunes para cada covariante y se resume en las salidas 5.15a y 5.15b. Nótese el 
efecto de tratamiento obtenido al introducir en el modelo las dos covariantes: F(1,20) = 6.012; P = .024, 
lo que permite al investigador concluir que existen diferencias estadísticamente significativas entre tra- 
tamientos. Es importante resaltar que se detectan diferencias significativas con el modelo ANCOVA (con 
las dos covariantes) pero no fueron significativas en el modelo ANOVA (sin las dos covariantes), con ra- 
zón de varianzas F(1,22) = 1.527; P =.230. 


SALIDA 5.15a 
Estimadores de los parámetros del modelo ANCOVA con 2 covariantes 
Límites IC 95% 
Parámetro Inferior | Superior 
Constante a 1.600 11.387 
A=1 . 5.729 0.462 


A=2 ¿ A : 
X1 z 1.507 3.126 
X2 Ñ 3.268 4.847 


SALIDA 5.15b 
Descomposición de la variación del modelo ANCOVA con 2 covariantes 
Fuentes | SC tipolIII F 
Modelo 1227.641 409.214 43.0034 
A 57.209 57.209 6.012 


X1 339.431 339.441 35.670 
X2 1093, 234 1093.234 | 114.884 
Residual 190.317 9.516 
Total 1417.958 
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La salida 5.16 presenta las medias de tratamiento ajustadas de la influencia de las covariantes. Ob- 
serve la diferencia que existe entre los promedios no ajustados del factor A que se muestran en la salida 
5.12 (al = 24.500 y a2 = 28.417). Una diferencia de casi 4 puntos en los promedios probablemente po- 
dría inducir a muchos investigadores a sospechar la existencia de diferencias significativas entre los 
niveles del factor A. Sin embargo, como hemos comprobado, las diferencias no fueron significativas con 
el submodelo ANOVA, quizás como consecuencia de la heterogeneidad de las unidades, mientras que sí 
lo fueron con el submodelo ANCOVA, aunque las medias de tratamiento ajustadas que se muestran en 
la salida 5.16 suponen una diferencia más pequeña (al: 24.911 y a2: 28.006, con diferencia d = 3.095) 
que las medias de tratamiento no ajustadas de la salida 5.12 (al: 24.500 y a2: 28.417, con diferencia 
d = 3.917). 


SALIDA 5.16 
Medias de tratamiento ajustadas (ejemplo 5.3) 


1C 95% 
A Media | Errortípico | Inferior | Superior 


24.911 0.892 23.051 26.770 
28.006 0.892 26.146 29.866 


; ¿ . E y > ; 
Las medias de tratamiento ajustadas por mínimos cuadrados Y; pueden obtenerse también apli- 
cando una generalización a más de una covariante de la ecuación 5.5 mediante la fórmula siguiente: 


Y ¡=Y; bx; X1) bo (X2¡ X2) (5.12) 


donde Y ¡ es la media de respuesta para el ¡-ésimo nivel de tratamiento, X1 ¡Y X2 ¡ son las medias de 
ambas covariantes para el ¡-ésimo nivel de tratamiento, X, y X2 son las medias globales de ambas 
covariantes y b, y b, son las pendientes de regresión para las respectivas covariantes que se asumen 
comunes atodos los tratamientos. Observando los datos pertinentes en la salida 5.12 para las medias de 
variable de respuesta y covariantes y en la salida 5.15a para las pendientes de regresión, la aplicación de 
la ecuación 5.12 produce los resultados siguientes: 


mes 
1 


24.500 — (2.317) (3.417 — 3.375) — (4.057) (3.250— 3.375) = 24.911 
28.417 — (2.317) (3.333 — 3.375) — (4.057)(3.500— 3.375) = 28.006 


E 
N 
l 


que aunque son desviaciones moderadas de los promedios de tratamiento originales, representan en 
este caso diferencias estadísticamente significativas. 


5.6. EXTENSIÓN DELOS MODELOS DE REGRESIÓN: LA REGRESIÓN 
MULTINIVEL 


En todos los modelos tratados hasta aquí el proceso de recogida de datos sigue los principios del 
muestreo aleatorio simple, es decir, se asume que las unidades individuales se seleccionan aleatoria- 
mente de una población. Sin embargo, en determinadas investigaciones psicológicas puede ser de inte- 
rés que el proceso de recogida de datos siga los principios del muestreo por grupos, en donde junto con 
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las unidades individuales se seleccionan también las unidades contextuales a las que éstos pertenecen 
tales como familias, escuelas o clínicas. Es bien sabido que los individuos pueden estar a su vez en va- 
rios grupos y que existen variables que describen a los individuos dentro de los grupos y variables que 
describen el contexto social. 

A partir de los estudios realizados por Merton (1957) y Lazarsfeld y Menzel (1961) para evaluar los 
efectos contextuales en la conducta, se han propuesto varios métodos para analizar la relación entre las 
personas y el medio ambiente en el que operan (p. ej., modelos de regresión estándar, modelos contex- 
tuales tradicionales o modelos ANCOVA, entre otros). Sin embargo, hasta finales de 1970 y principios de 
1980 ha existido poco progreso en este área, fundamentalmente debido a la falta de técnicas de estima- 
ción de parámetros adecuadas y del software estadístico apropiado (Hox y Roberts, 2011). Pero a me- 
diados de la década de 1980 diversos investigadores (Aitkin y Longford, 1986; Bryk y Raudenbush, 1987; 
de Leeuw y Kreft, 1986; Goldstein, 1986) desarrollaron lo que hoy se conocen como MODELOS MULTINI- 
VEL, que han adquirido una relevancia cada vez más importante en muchos campos de investigación, 
incluyendo la educación, la economía, la psicología, la sociología y la salud pública. Estos modelos re- 
conocen la estructura jerárquica (o anidada) de los datos y facilitan la estimación de los cambios que se 
producen en los diferentes niveles de la jerarquía (p. ej., la familia, la escuela o el hospital), bien sea en 
un momento del tiempo o en momentos diferentes. Las consecuencias de no prestar atención a la es- 
tructura jerárquica de los datos se centran sobre todo en la falta de independencia dentro de los grupos, 
el sesgo de agregación y el problema de precisar adecuadamente la unidad de análisis. 

Básicamente, el objetivo fundamental de los modelos multinivel radica en dar cuenta de la varia- 
bilidad existente en las respuestas medidas en el nivel de análisis inferior (p. ej., el sujeto participante) 
considerando toda la información disponible en los niveles restantes. Al combinar en un modelo re- 
lativamente simple la información procedente de las diferentes estructuras jerárquicas existentes en 
los datos, esta metodología ayuda a comprender mejor los fenómenos bajo investigación, incrementa 
la validez externa y evita que se cometan algunas falacias al realizar inferencias (p. ej., interpretar da- 
tos individuales a nivel agregado o viceversa). Su empleo también permite investigar en qué medida los 
efectos causales atribuidos a las variables explicativas de nivel inferior están determinados o moderados 
por las variables explicativas registradas a un nivel superior. 

Además de razones de índole metodológico, también existen razones de índole estadístico que acon- 
sejan tener en cuenta la estructura jerárquica de los datos. Por regla general, ignorarla conduce a sub- 
estimar los errores típicos y, como consecuencia, a inflar las tasas de error Tipo I. Para comprender este 
problema, considérese una situación en la cual un investigador educativo haya seleccionado N estu- 
diantes a partir de J clases. Si ignorara la estructura anidada de los datos, aparentemente, el diseño 
constaría de N unidades de análisis mutuamente independientes entre sí. No obstante, es muy proba- 
ble que esta apreciación sea errónea. Si las variables explicativas registradas en el nivel individual (p. ej., 
el grado de motivación de los estudiantes o las horas semanales que los estudiantes dedican al estudio) 
están afectadas por variables registradas en el nivel grupal, entonces las unidades pertenecientes a una 
misma unidad contextual o clase no serán verdaderamente independientes. En términos estadísticos el 
efecto del agrupamiento viola el supuesto de independencia que subyace a la mayor parte de modelos 
analíticos de las estructuras LM y GLM. 

Conviene tener presente que el problema reseñado no ocurre sólo en las investigaciones que no 
hacen uso de la asignación aleatoria, sino también en las investigaciones que asignan aleatoriamente 
grupos intactos seleccionados al azar (p. ej., familias, aulas, clínicas o escuelas) a las condiciones de tra- 
tamiento. Este tipo de estudios son cada vez más comunes en la investigación clínica, educativa y social 
(Hedges y Hedberg, 2007). Si los grupos constituyen la unidad de asignación adecuada, es razonable 
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pensar que sean independientes unos de otros, pero no necesariamente sucederá lo mismo con las uni- 
dades que se encuentran dentro de ellos (Hox, 2010; Snijders y Bosker, 2012). El valor de la correlación 
intraclase (1CC) puede utilizarse como un indicador de la dependencia dentro de los grupos. De este 
modo, excepto cuando no exista asociación entre los sujetos del grupo (1CC = 0), las inferencias extraí- 
das con los métodos de análisis que ignoran la estructura jerárquica de los datos, como ocurre con el 
modelo de la regresión clásica, serán erróneas. Además, si se elige trabajar sólo a nivel individual, igno- 
rando las características de los grupos, se puede caer en la falacia de extraer inferencias acerca de los 
grupos a partir de las relaciones encontradas a nivel individual. 

El supuesto de independencia se puede garantizar si se omiten las características individuales y se 
emplean las medias grupales. Sin embargo, a menos que la relación entre la variable de respuesta y las 
variables explicativas sea la misma dentro y a través de las unidades de análisis (ICC = 1), esta práctica 
constituye más un problema que una solución. Como ha demostrado Robinson (1950), las relaciones 
a nivel individual suelen revertirse mediante agregación (se pueden obtener resultados diferentes para 
una misma variable dependiendo del nivel de análisis adoptado). Por lo tanto, no es de extrañar que las 
inferencias realizadas acerca de los individuos a partir de las relaciones encontradas a nivel grupal sean 
ineficientes (debido a la pérdida de potencia que supone trabajar con variables agregadas) y sesgadas. El 
análisis multinivel incorpora ambos niveles en el modelo, de tal suerte que el investigador no necesita 
optar entre hacer un análisis a nivel individual ignorando la variación entre grupos o hacer un análi- 
sis agregado ignorando la variación dentro de los grupos. Mediante el análisis de niveles múltiples las 
unidades de observación son tratadas como miembros pertenecientes a determinados grupos, debido 
a que el investigador está interesado tanto en los individuos como en el contexto en que operan. 


5.6.1. El análisis tradicional y sus consecuencias 


Supongamos que un investigador educativo se interesara en constatar si existe relación funcional 
entre rendimiento (Y) de los estudiantes y los años de experiencia de los profesores (Z), y que se dis- 
pone para ello de una muestra de 47 clases o aulas seleccionadas al azar. Sabiendo que el rendimiento 
(Y), una variable de respuesta numérica continua, depende de algunas características de los estudian- 
tes, el investigador contempla como predictor una característica de los estudiantes, las horas de estudio 
semanales (X). 


A. Modelo de regresión clásico 


Un posible enfoque analítico consiste en tratar a todos los profesores como si fuesen idénticos e 
intercambiables. Bajo esta situación el análisis se efectúa con el modelo de regresión lineal clásico, 


Y, = Po+ PB1X; + ej (5.13) 


donde Y; denota el rendimiento del ¡-ésimo estudiante, X; son las horas de estudio empleadas por el 
mismo estudiante y e; es el error residual, que describe la variabilidad en el rendimiento de los estu- 
diantes en el conjunto de los profesores. El coeficiente fp representa el valor que toma la variable de 
respuesta cuando el número de horas dedicado al estudio semanal es cero (si consideramos a esta va- 
riable centrada, entonces fp es la media del rendimiento, o sea, el valor pronosticado para la media de 
horas de estudio semanales) y 6] indica el cambio que se produce en rendimiento por unidad de cambio 
en horas de estudio. 
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B. Modelos de regresión separados 


Para evitar interpretar datos individuales a nivel agregado, puede ser de interés investigar cómo afec- 
ta al rendimiento el número de horas dedicadas al estudio por los estudiantes instruidos por profesores 
diferentes (anidados en distintas clases). O sea, interesa saber si la experiencia de los profesores afecta a 
la relación entre el rendimiento y las horas de estudio. Este objetivo puede abordarse de varias formas, 
una de las cuales consiste en usar modelos de regresión separados. Mediante este enfoque los efectos 
específicos de los profesores se mantienen esencialmente constantes, ya que tan sólo los datos de los 
estudiantes anidados dentro de los profesores se utilizan para derivar estimaciones de los parámetros. 
Hasta cierto punto, mediante este enfoque el efecto de profesores se modela implícitamente. Aunque 
es posible efectuar comparaciones estadísticas para analizar los resultados obtenidos con este enfoque, 
normalmente lo que se hace es comparar visualmente la magnitud de las intercepciones y pendientes 
obtenidas tras realizar análisis de regresión separados con cada profesor. A pesar de que las estimacio- 
nes de los parámetros varíen a lo largo de las regresiones separadas, la evaluación visual no proporciona 
evidencia de si dicha variación es estadísticamente significativa. Tanto las comparaciones visuales co- 
mo las pruebas estadísticas sólo proporcionan información sobre las diferencias en el conjunto de las 
ecuaciones, pero no proporcionan información acerca de cómo y por qué varían los datos, ya que no 
pueden discernir la relación entre los niveles más altos y más bajos de los datos. 


Ya = Poa+PuX;+e (5.14) 
Yi = PBo2+PB12X¡+€j2 
Yi = Boj+BrjXi+eij 


C. Modelo contextual aditivo 


Otro enfoque para analizar los datos del ejemplo consiste en utilizar un modelo tipo ANCOVA, es 
decir, un modelo que usa las pendientes como respuestas y que incluye en la ecuación los años de ex- 
periencia de los profesores (Z). En este caso la ecuación 5.13 adopta la forma que sigue: 


Yij = Boj+B1Xi¡+€5j (5.15) 
Boj = Bo+P2Zj 
Yi = Po+PiXi¡+P22%¡+€j; 


donde Y;; denota el rendimiento del ¡-ésimo estudiante instruido por el ¡-ésimo profesor y Z; es la 
experiencia del profesor. El coeficiente fp representa ahora el valor que toma la variable de respuesta 
cuando las horas dedicadas al estudio y los años de experiencia de los profesores son cero, 6, representa 
el efecto del número de horas de estudio sobre el rendimiento suponiendo constante la experiencia de 
los profesores y f2 representa el efecto de la experiencia del profesor sobre el rendimiento suponiendo 
constante las horas de estudio. Como se puede apreciar en la ecuación 5.15, este enfoque permite tener 
distintas intercepciones, pero asume una misma pendiente. Es decir, permite que los estudiantes ins- 
truidos por diferentes profesores tengan un nivel de rendimiento diferente, pero el efecto de las horas de 


OEdiciones Pirámide 


Modelos ANCOVA y regresión multinivel 217 


estudio sobre el rendimiento no depende de la experiencia de los profesores (o sea, las líneas de regre- 
sión parten de puntos de intercepción diferentes, pero la regresión de Y sobre X es idéntica para todos 
los profesores). Sin embargo, aunque la inclusión de la variable de nivel profesor produce información 
interesante acerca de la variación contextual, la forma de la relación entre los datos medidos a nivel de 
estudiante con los datos registrados a nivel profesor sigue siendo desconocida. 


D. Modelo contextual no-aditivo (o interactivo) 


Los problemas planteados por los modelos de regresión separados y contextual aditivo, se pueden 
aliviar parcialmente utilizando un modelo de regresión donde se puedan variar tanto las intercepciones 
como las pendientes. En el contexto del modelo lineal clásico, el modelo interactivo trata la relación 
entre una variable independiente y una variable de respuesta como moderada por una o más variables 
independientes. En nuestro ejemplo, tendría sentido pensar que la relación entre las horas dedicadas 
al estudio semanal y el rendimiento dependiese de una variable de nivel superior, la experiencia de los 
docentes. En este caso la ecuación de regresión adoptaría la forma siguiente: 


Yij = Boj+PijXij+€ij (5.16) 
Boj = Po+P22; 

Bi = Pi+P32j; 

Yi = PBo+PiXi¡+P22¡+ P3Xi¡Zj+ ei; 


donde el coeficiente f3 nos informa si los profesores que tienen una mayor experiencia difieren de los 
que la tienen menor, en términos de intensidad de la relación entre horas dedicadas al estudio semanal 
y rendimiento de los estudiantes. Repárese que en este modelo ni fp; ni 6 ¡ varían aleatoriamente dado 
que cambian estrictamente en función de Z;, lo que equivale a decir que no hay ningún componente 
aleatorio asociado a la interacción, y que la pendiente y la intercepción sólo son determinados por Z;. 

En comparación con el modelo contextual aditivo y el enfoque de las regresiones separadas, el mo- 
delo interactivo resulta más atractivo, ya que permite combinar los diferentes niveles de los datos. En 
lugar de ignorar las características grupales, como suele hacerse con el enfoque de las regresiones sepa- 
radas, o las posibles relaciones entre las variables de niveles diferentes, con este enfoque se contemplan 
tanto las características específicas de las diferentes unidades como las relaciones entre ellas. Todo esto 
produce estimaciones de los parámetros que nos permiten considerar cómo las observaciones indivi- 
duales varían con las variables grupales. Sin embargo, el problema con el modelo interactivo es que 
implícitamente asume que las variables explicativas medidas en el nivel superior dan cuenta completa- 
mente de las diferencias existentes en este nivel. La razón última hay que buscarla en la incorporación 
de un único componente de error en el modelo, el correspondiente al nivel inferior. 


5.6.2. El análisis multinivel 


Los MODELOS MULTINIVEL O MODELOS DE NIVELES MÚLTIPLES tratan de dar cuenta de la variabilidad 
en el nivel de análisis inferior considerando la información existente en los otros niveles. Si el tamaño 
muestral de las distintas unidades de análisis es el adecuado, estos modelos, además de preservar la es- 
tructura anidada de los datos, proporcionan a los investigadores un conjunto de herramientas flexibles 
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y potentes que les permiten efectuar estimaciones más precisas que las proporcionadas por las técnicas 
tradicionales y desarrollar modelos conceptualmente más adecuados. 

Continuando con el enunciado del ejemplo anterior, podemos analizar estos datos ajustando ecua- 
ciones de regresión por separado con cada profesor con el fin de predecir el rendimiento de los estu- 
diantes a partir de las horas de estudio mediante: 


Yi¡=boj+Db1¡Xi¡+€jj (5.17) 


donde bo; y b1¡ son respectivamente la intercepción y la pendiente de regresión y e;; es el término de 
error residual (que mide la variabilidad que existe entre el rendimiento de un estudiante y el rendimien- 
to medio de la clase o profesor donde se anida). Si se centra la variable explicativa X; ¡» entonces bo j 
denota el rendimiento promedio de los estudiantes instruidos por el ¡-ésimo profesor. Nótese que la di- 
ferencia entre este modelo y el modelo de regresión de la ecuación 5.16 no radica en que cada profesor 
tenga coeficientes de intercepción by; y pendiente by ¡ diferentes, sino en que los coeficientes son consi- 
derados aleatorios en vez de fijos. Como consecuencia, tienen una distribución con su correspondiente 
media y varianza. 

Una vez aclarado cómo pueden variar los coeficientes bp; y b1¡ a través de los profesores, estamos 
en condiciones de desarrollar un modelo que explique la variación de los coeficientes, introduciendo la 
variable explicativa de nivel superior Z;, los años de experiencia de los profesores. En concreto, 


Doj 
by 


Yoo + Y01%j + Uoj (5.18) 
Y1i0+Y11%j¡+U7j 


donde yoo denota el rendimiento medio general, yo, indica el cambio promedio que se produce en el 
rendimiento de los estudiantes por unidad de cambio en experiencia de los profesores (si el coeficiente 
es positivo, el rendimiento medio será más alto en las clases que enseñan profesores con mayor expe- 
riencia y más bajo si el coeficiente es negativo), Y1o indica el cambio promedio que se produce en el 
rendimiento de los estudiantes por unidad de cambio en las horas de estudio (se interpreta en un sen- 
tido similar al caso anterior), y11 indica en qué medida la relación entre el rendimiento medio de los 
estudiantes y las horas que dedican al estudio depende de la experiencia de los profesores (si el coefi- 
ciente es positivo, el efecto de las horas de estudio sobre el rendimiento se incrementa con la experiencia 
de los profesores y disminuye si es negativo), uy; denota el efecto único de la clase j en el rendimiento 
medio de los estudiantes manteniendo constante la experiencia de los profesores (o sea, mide la desvia- 
ción del rendimiento medio obtenido con cada profesor del rendimiento medio general) y u]; denota el 
efecto único de la clase ¡ en la relación entre el rendimiento medio de los estudiantes y las horas de es- 
tudio manteniendo constante la experiencia de los profesores (mide la desviación de la pendiente, o la 
relación rendimiento medio-horas de estudio, dentro de cada profesor, respecto de la pendiente media 
general). 

De acuerdo a la práctica común en el modelado multinivel, se asume que los residuales a nivel de 
estudiante, e; j» tienen una distribución normal con media cero y varianza 0?. También se asume que 
a nivel de la clase los residuales uy; y u1¡ tienen una distribución normal bivariante con media cero, 
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varianzas Too y T11 respectivamente, y covarianza Tp1. Formalmente, 


E(up;)= Eu] ¡)=Elejj)=0 
V(e¡¡)=0*?, Víuoj) =700, Vía j)=71 
C(e;j, U0¡) =Cle;¡, 41) =0, Cluoj, 41) = To1 


A partir de estos supuestos resulta relativamente fácil comprobar que la varianza de Y;; es igual a 
Too + X¿,To1 + Xiu +0?. Repárese en que por separado los distintos componentes de Y;; son homo- 
géneos, pero no ocurre lo mismo globalmente, ya que la varianza de Y;¡ varía como una función de 
las variables explicativas de nivel inferior. Es evidente que la varianza de Y;;¡ sólo será constante si el 
coeficiente b,; se restringe a ser fijo (o sea, igual en todas las clases). Bajo el modelo de intercepción 
aleatoria resultante (modelo que asume un rendimiento medio distinto para cada profesor, pero idén- 
tica pendiente, donde el cambio que se produce en el rendimiento de los estudiantes por unidad de 
cambio en las horas de estudio es el mismo para todos los profesores), los valores esperados para V (Y; p) 
y C(Yij> Y j) se reducen, respectivamente, a Too + y? y Too- 

Combinando los modelos a nivel estudiante y clase (Ecuaciones 5.17 y 5.18), se obtiene el modelo 
que usa las intercepciones y las pendientes aleatorias como respuestas: 


Yij=Y00 + Y10XG¡+Y01% +Y11X5¡%j + Uo¡+ UI ¡X¡¡+ jj (5.19) 


donde Y;¡ puede ser una función de la intercepción global (yoo) y de los efectos principales horas de- 
dicadas al estudio X(y10) y experiencia de los profesores Z(yo1), o de la interacción cruzada entre las 
variables X y Z(y11) más un error aleatorio: 4y;+ u]¡X¡¡+€¡¡. La variable e,; varía con el estudiante 
dentro de la clase; sin embargo, las variables up; y uy; son constantes para todos los estudiantes dentro 
de las clases, pero varían entre las clases. El término de interacción aparece en la ecuación debido al 
modelado de la pendiente de regresión bj; de la variable de nivel estudiante X con la variable del nivel 
clase Z. La interacción es típicamente moderadora, es decir, Z actúa como variable moderadora para la 
relación entre X e Y. 

Las ideas presentadas en los apartados anteriores pueden ser fácilmente extendidas a modelos je- 
rárquicos de dos niveles más complejos (que incluyan más variables explicativas), a modelos de tres 
niveles, e incluso a modelos jerárquicos con un número más elevado de niveles con variables depen- 
dientes continuas o categóricas. Ateniéndonos al ejemplo que hemos venido manejando, una manera 
posible de generalizar el modelo consiste en incluir una unidad de análisis de tamaño superior o una 
unidad de tamaño inferior, como puede ser la escuela o la dimensión temporal (para modelar el cambio 
a lo largo del tiempo). En ambos casos se cuenta con tres tipos de unidades experimentales (estudian- 
te/clase/escuela o medidas repetidas/estudiante/clase) anidadas o agrupadas en otras de nivel supe- 
rior. Una exposición más completa que esta introducción del análisis multinivel puede consultarse en 
Raudenbush y Bryk (2002), Hox (2010), Goldstein (2011) o Snijders y Bosker (2012). 


5.6.3. Un ejemplo de análisis multinivel 


Núñez et al. (2014) analizaron la contribución de variables del estudiante y variables del contexto 
en la predicción del rendimiento en Biología (RB) de 988 bachilleres portugueses anidados en 57 clases. 
Para contribuir a explicar el objetivo declarado, RB es la variable dependiente pronosticada por un con- 
junto de variables explicativas registradas a nivel del estudiante (nivel 1) y a nivel de clase (nivel 2). Las 
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variables del nivell fueron: los enfoques de aprendizaje (EA, con niveles 0 = superficial y 1 = profundo), 
el conocimiento previo (CP, escala entre 0 y 20 puntos), la asistencia a clase (AC, escala entre 0 y 20 au- 
sencias), los deberes escolares realizados (DE, con niveles O = inferior al 80% y 1 = superior al 80%), el 
género de los estudiantes (GE, con niveles O = varones y 1 = mujeres), el tiempo de estudio (TE, escala 
entre 0 y 25 horas semanales) y el nivel educativo de los padres (EP, con niveles 1 = primaria hasta 5 = 
doctorado). Además de los enfoques de enseñanza per se (EE, con niveles 0 = centrado en el profesor y 
1 = centrado en el estudiante), otras variables explicativas incluidas en el nivel 2 fueron: la experiencia 
docente (ED, escala entre 0 y 36 años), el tamaño de la clase (TC, escala entre 8 y 33 estudiantes), y el 
género de los docentes (GD, con niveles 0 = varones y 1 = mujeres). 

La naturaleza jerárquica de los datos aconseja el empleo de modelos jerárquicos de dos niveles. El 
proceso de modelado estadístico se realiza en cuatro etapas. Se comienza formulando un modelo nulo 
o incondicional, que es un modelo ANOVA de efectos aleatorios, para precisar la cantidad de varianza 
a explicar en ambos niveles. Este modelo servirá como referente para evaluar el ajuste global de mo- 
delos condicionales más complejos. Después se ajustará el modelo de nivel 2 con el fin de conocer en 
qué medida las variables del contexto educativo explican el RB de los estudiantes. Posteriormente, se 
ajustará el modelo de nivel 1 con el fin de determinar en qué grado las variables del estudiante predicen 
el rendimiento. Finalmente, se procederá al modelado conjunto de los datos con el objeto de estimar la 
posible interacción existente entre las variables de ambos niveles. 


A. Modelo nulo o incondicional 


El análisis comienza ajustando el MODELO NULO O INCONDICIONAL, con intercepciones aleatorias: 


RBij = boj+€ij (Modelo de nivel 1) (5.20) 
Doy = Yoo +Uoj (Modelo de nivel 2) 
RBi; = Yoo +Uoj+ €; (Modelo combinado) 


donde RBj;¡ es el rendimiento en biología observado para el ¡-ésimo estudiante anidado en la ¡-ésima 
clase, Yoo es el RB global de los estudiantes, uy¿ denota la variabilidad que existe entre las clases en tér- 
minos del rendimiento medio de los estudiantes y e; ; denota la variabilidad que existe en el rendimiento 
de los estudiantes anidados en la ¡-ésima clase. Se asume que los términos aleatorios del modelo son 
NID con media cero y varianza constante, o sea, uy¡ - NID(0,T00) y ei; - NID(O, 07). Repárese que se 
ha asumido que las clases estudiadas representan una muestra aleatoria de una determina población, 
por lo tanto las inferencias no son exclusivas para las clases de la muestra. 

Con este modelo incondicional se formula que el rendimiento se puede explicar mediante una parte 
fija, que contiene un valor global que es igual para todas las clases y para todos los estudiantes, más una 
parte aleatoria que indica la variabilidad asociada con los diferentes niveles implicados en el análisis: 
nivel del estudiante (nivel 1) y nivel del profesor o clase (nivel 2). Se trata de verificar silos componentes 
de varianza asociados con el rendimiento de los estudiantes dentro de las clases y con el rendimiento 
medio de los estudiantes entre las clases difieren significativamente de cero, pues si no fuera así no 
tendría sentido analizar los datos a dos niveles. 

En la salida 5.17 se muestran los resultados obtenidos tras ajustar el modelo nulo o incondicional a 
los datos de Núñez ef al. (2014). Como se puede observar, se constata que la estimación del rendimiento 
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promedio en esta muestra de clases (13.02) difiere de cero: £(56) = 65.98; P < .001. Sin embargo, el resul- 
tado más destacable es la existencia de diferencias estadísticamente significativas en el rendimiento de 
los estudiantes dentro de las clases (e;; = 9.840; P < .001), así como en su rendimiento promedio a través 
de las mismas (up; = 1.620; P < .001). En el 95% de los casos cabe esperar que la magnitud de la variación 
entre las clases, en cuanto al rendimiento promedio se refiere, se encuentre dentro del intervalo (10.45, 
15.56). Esto indica un rango moderado de variabilidad en los niveles de rendimiento promedio entre las 
clases en esta muestra de datos. A su vez, la variabilidad observada en el rendimiento académico (1.62 
+ 9.84 = 11.46) es principalmente debida a las variables de nivel 1: un 85.9% se debe a las variables de 
nivel de estudiante y el 14.4% restante es debida a las variables de nivel de clase (unas clases generan 
más rendimiento que otras). 

El grado de dependencia entre las observaciones de los estudiantes dentro de una misma clase fue 
moderado:ICC = 1.620/(1.620 + 9.840) = 0.141. Al no cumplirse el supuesto de independencia del mo- 
delo de regresión clásico, es aconsejable efectuar el análisis de los datos a dos niveles (individuo y clase). 


SALIDA 5.17 
Ajuste del modelo nulo o incondicional a los datos de Núñez et al. (2014) 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de varianza -2563.9 5138.6 (3) 5144.2 5149.3 
Efectos aleatorios 
Parámetros Estimador E. típico Zde Wald | P>|Z| 
Intercepción (To0) 1.620 0.416 3.900 0.000 
Residual (0?) 9.840 0.456 21.579 0.000 
ANOVA efectos fijos 

Fuentes de variación gl glo F P>F 

Intercepción 13.023 0.197 65.98(56) .000 


B. Modelos con variables explicativas a nivel de clase 


El modelo nulo no contempla las características de los estudiantes ni de las clases; únicamente pro- 
porciona una base sobre la cual poder comparar modelos más complejos. Sin embargo, el rendimiento 
podría ser explicado por las características de los estudiantes que conforman las clases, por las carac- 
terísticas de cada clase, así como por el efecto conjunto de ambas. Por consiguiente, una vez que se 
ha puesto de relieve que el rendimiento medio es más elevado en unas clases que en otras, se requiere 
comprender el porqué de este resultado. Para ello se llevó a cabo un nuevo análisis incorporando las 
variables explicativas registradas a nivel de clase, a saber: EE, GP, ED y TC, y se formula el MODELO 
CONDICIONAL CON INTERCEPCIÓN ALEATORIA: 


RBi¿ = bo+ej; (Modelo de nivel 1) (5.21) 
Doy = Yoo +Y0OLEE¡+Y02GD¡+Yo03TC¡+Y04ED; + Up; (Modelo de nivel 2) 
RBi; = Yoo +Y0EE¡+Y02GD;¡+Yo3TC;¡+ Yo4ED¡ + ug ¡ + e;; (Modelo combinado) 


donde RB;¡ denota el rendimiento observado para el ¿-ésimo estudiante anidado en ¡-ésima clase, Yoo 
representa el desempeño promedio de los estudiantes instruidos por docentes de experiencia media en 


OEdiciones Pirámide 


222 Diseños de investigación en Psicología 


grupos de tamaño medio, yo1 indica si el rendimiento de los estudiantes instruidos con métodos centra- 
dos en el docente difiere de los instruidos con métodos centrados en el discente, controlando los efectos 
de las variables GD, TC y EP, yo2 indica si el rendimiento de los estudiantes instruidos por mujeres di- 
fiere de los instruidos por varones, controlando los efectos de las variables EE, TC y ED, yo3 denota el 
cambio en el rendimiento promedio de los estudiantes por cada unidad de aumento en el tamaño de 
los grupos de clase, controlando los efectos de las variables EE, GD y ED y yo4 denota el cambio en el 
rendimiento promedio de los estudiantes como consecuencia del incremento de la experiencia del pro- 
fesor, controlando los efectos de las variables EE, GD y TC. Finalmente, uy ¡representa la variación en 
el rendimiento promedio entre las clases, mientras que e;;¡ representa la variación dentro de las mismas. 
Los resultados de ajustar el modelo de la ecuación 5.21 y otro modelo más sencillo excluyendo los 
efectos manifiestamente no significativos aparecen recogidos en la salida 5.18. En el primero de los dos 
modelos ajustados (Modelo A), no hay evidencia de que el rendimiento medio de los estudiantes mejore 
significativamente en función del EE, GD, ED y TC. El panorama cambia ligeramente ajustando un mo- 
delo condicional más sencillo (Modelo B). Aunque la diferencia entre los valores de la intercepción de 
cada modelo es pequeña (13.162- 12.312 = 0.851), con el modelo reducido se aprecia una relación mar- 
ginalmente no significativa entre los EE y el rendimiento medio de los estudiantes (yo1 = .907; p = .055). 
Examinando la varianza correspondiente al nivel 2, tampoco se aprecia que se reduzca significativa- 
mente al incluir la variable EE en el nivel de clase; específicamente, mientras la varianza incondicional 
era 1.620 la varianza condicional vale 1.46, lo que indica que alrededor de un 10% de la variabilidad 
observada en el rendimiento medio es explicado por los EE. También se puede observar que el valor del 
ICC condicional o residual sólo se redujo en dos centésimas respecto del modelo nulo o incondicional, 
tras controlar el efecto de la variable EE, pasando de ICC; = 0.141 a ICC) = 1.46/(1.46+ 9.84) = 0.12. 


SALIDA 5.18 
Ajuste de dos modelos (A y B) condicionales con intercepción aleatoria y múltiples variables explicativas 
Modelo A Modelo B 
Estructura de covarianza Desvianza (q) AIC BIC Desvianza (q) AIC BIC 
Componentes de la varianza 5132.9 (7) | 5146.9 | 5181.2 5134.9 (4) | 5142.9 | 5162.5 
Efectos aleatorios 
Parámetro Estimador(SE) Zz P>z | Estimador(SE) z P>z 
Intercepción (Tp0) 1.38(.38) 3.68 <.001 1.46 (0.39) 3.75 <.001 
Residual (0?) 9.85(.46) 21.56 <.001 9.84 (.46) 21.5 <.001 
Efectos fijos 
Efecto Estimador(SE) gl P>|t| | Estimador(SE) gl P>|t| 
Intercepción 13.162 (1.02) 60 <.001 12.311 (0.41) 53 <.001 
EE 0.724 (0.47) 54 ¿131 0.907 (0.46) 52 <.055 
GD 0.037 (0.49) 54 .940 
TC 0.052 (0.04) 58 .199 
ED 0.015 (0.02) 55 .460 


Aunque el Modelo B no permite concluir que la forma de instruir de los profesores afecte al rendi- 
miento de los estudiantes, dicha variable no será extraída del análisis por resultar marginalmente no 
significativa y también por ser central en la presente investigación. Además, si se realiza un ajuste con- 
dicional o se compara el valor de los criterios AIC y BIC, se advierte que el Modelo B permite obtener 
un mejor ajuste alos datos. Ala misma conclusión hubiésemos llegado de haber utilizado el A/C basado 
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en la verosimilitud condicional, en lugar de la verosimilitud marginal, o el BIC basado en la inferencia 
bayesiana (véase Vallejo, Tuero-Herrero, Núñez y Rosário, 2014). 


C. Modelos con variables explicativas a nivel de estudiante 


El modelo ajustado en la sección anterior no contempla las características de los estudiantes, y por 
ello se desconoce por qué existen diferencias en el rendimiento de los estudiantes, ni tampoco hay evi- 
dencias de que la variabilidad observada entre los profesores no sea más que un artefacto debido al 
distinto perfil de los estudiantes que enseñan los profesores. Para responder a esta cuestión se realiza 
un nuevo análisis con las siete variables explicativas registradas a nivel estudiante (EA, CP, DE, GE, 
EP, TE y AC). Las dos dos últimas variables fueron centradas con respecto a la media de su grupo. Ini- 
cialmente, se realizó una prueba previa para comprobar la variación aleatoria de las pendientes y se 
observó que todas se mantenían constantes, a excepción de la correspondiente a la variable explicativa 
EA, que variaba de clase a clase. El MODELO DE EFECTOS ALEATORIOS resultante es: 


RB;j boj + b¡¡EA;j + P2TE;; + PB3CP;; + PA4DE;¡ + P5AC;; + B6GE; + B7EP;; +ej; (nivel 1) (5.22) 
Doy = Yoo +Upj bi¡=Y10+U]; (nivel 2) 
RBi¿ = Yo0+Y10EA¡¡+Y20TE¡¡+Y30CP¡¡+Y40DE;¡+Y50AC¡¡+Y60GE;¡+Y70EP;¡+ 


+ Up¡+Uu¡+u¡¡EAj¡+ejj (combinado) 


donde RB;¡ denota el rendimiento observado para el ¿-ésimo estudiante anidado en ¡-ésima clase; Yoo 
representa el RB medio de los estudiantes; y10 indica cómo afecta el EA al RB, controlando los efectos 
de las variables restantes; y2p denota el cambio en el RB medio de los estudiantes por cada unidad 
de aumento en las horas de estudio, controlando los efectos de las variables restantes; y3o indica la 
relación existente entre CP y RB, controlando los efectos de las variables restantes; y4p indica la relación 
existente entre DC y RB, controlando los efectos de las variables restantes; y5p denota el cambio en el RB 
medio de los estudiantes por cada unidad de aumento en el absentismo escolar, controlando los efectos 
de las variables restantes; yso indica la relación existente entre el GE y RB, controlando los efectos de 
las variables restantes, y y70 indica la relación existente entre el nivel EP y RB, controlando los efectos 
de las variables restantes. Finalmente, 1; j indica si la relación entre los EA y el RB medio varía de clase 
a clase. 

En la salida 5.19 se muestran los resultados más importantes obtenidos tras ajustar sendos modelos 
de efectos aleatorios. De acuerdo con el primer modelo (Modelo A), no hay evidencia de que existan 
cambios en el RB medio en función del TE (P = .125). Consideramos de interés mencionar que exis- 
tía una relación estadísticamente significativa entre las variables TE y RB cuando no se controlaba el 
efecto de la variable EA, pero, como se observa en la salida, dicha relación resultó marginalmente no 
significativa cuando se controló el efecto de esta última variable. Además, no aparecieron diferencias 
estadísticamente significativas entre el GE y el RB (P = .409). Tampoco se pudo rechazar la hipótesis de 
no asociación entre la variable DE y el RB (P = .447). Por último, los resultados para el Modelo A ponen 
de relieve que la relación entre EA y el RB medio dentro de las clases variaba significativamente a lo 
largo de las mismas (u; ¡=1.96;P =.027). Sin embargo, no existía evidencia de que la forma de estudiar 
dependiese del rendimiento medio de la clase, pues la covarianza de pendiente e intercepción a través 
de las clases (1p1) no fue estadísticamente significativa (P =.119). 

Se constata la conveniencia de ajustar un modelo más simple, por ejemplo, un modelo en el que aún 
se permita a la intercepción y a la pendiente variar a través de las clases, pero se eliminen las variables 
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que no resultaron significativas en el Modelo A. Es decir, es posible que un modelo más parsimonioso 
(Modelo B) ofrezca un ajuste razonable de los datos. Como puede comprobar examinando los estadísti- 
cos de ajuste mostrados en la parte derecha de la salida 5.19, el Modelo A no explica mejor los datos que 
el Modelo B y éste es más parsimonioso. Por lo tanto, seleccionaremos finalmente el Modelo B. 

Una vez ajustado el Modelo B, cabe destacar que, en promedio, existe una relación estadísticamente 
significativa dentro de las clases entre los EA y RB (yo1 = 1.87; P < .001). Teniendo en cuenta el signo de 
la asociación se aprecia que los estudiantes que emplean un enfoque profundo en su estudio alcanzan 
logros significativamente mayores que los estudiantes que suelen emplear un enfoque superficial. Tam- 
bién se constató que el CP predice positiva y significativamente el RB (yo2 = .713; P < .001). Además, se 
encontró que tanto el AC como nivel EP afectaban significativamente al RB (yo5 = —.111,P < .0001 y 
Yo7 = .381,P < .001, respectivamente); sin embargo, mientras que el primero reducía el rendimiento el 
segundo lo incrementaba. Resaltar, por último, que la variabilidad residual dentro de las clases y a través 
de los mismas aún permanece significativa (e;; = 8.357, P < .001; up; = .706, P =.015). Por este motivo, 
es muy importante seguir investigando otras posibles causas no tenidas en cuenta en este análisis y que 
pueden explicar, al menos en parte, tales variabilidades. Repárese, no obstante, que en este caso no sólo 
se redujo la varianza dentro de las clases desde 9.848 hasta 8.357, sino que también se redujo la varianza 
entre las clases desde 1.385 hasta 0.706. 


SALIDA 5.19 
Ajuste de dos modelos (A y B) condicionales de efectos aleatorios con múltiples variables explicativas de nivel 1 


Modelo A Modelo B 
Estructura de covarianza Desvianza (q) AIC BIC Desvianza (q) AIC BIC 
Componentes de la varianza 4973.9 (12) | 4997.9 | 5056.6 4980.7 (8) | 4996.7 | 5035.8 
Efectos aleatorios 
Parámetro Estimador(SE) Zz P>z | Estimador(SE) Zz P>z 
TOO 1.276(0.539) 2.36 .018 0.706(0.291) 2.42 .015 
TO1 —0.922(0.591) -1.56 A19 
T11 1.833(0.884) 2.21 .027 0.900(0.437) 2.06 .039 
a? 8.205(0.389) 21.08 <.001 8.357(0.394) 219 <.001 
Efectos fijos 
Efecto Estimador(SE) gl P>|t| | Estimador(SE) gl P>|t| 
Intercepción 9.696(0.467) 126 <.001 9.449(.434) 130 <.001 
EA 1.785(0.298) 56 <.001 1.870(0.254) 127 <.001 
TE 0.029(0.019) 945 0.125 
CP 0.671(0.181) 8l <.001 0.713(0.179) 89 <.001 
DE 0.873(1.147) 968 447 
AC —0.109(0.025) 938 <.001 -0.111(0.025) 940 <.001 
GE —0.943(1.142) 969 .409 
EP 0.356(0.086) 900 <.001 0.382(0.086) 904 <.001 


D. Modelo con variables explicativas de nivel 1 y 2 


Una vez ajustados por separado un modelo para las variables registradas en el nivel de estudiante y 
otro para las variables registradas en el nivel de clase, consideraremos un modelo que contenga variables 
de ambos niveles. Dicho modelo nos permitirá detectar la posible existencia de interacciones cruzadas 
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entre los mismos. Combinando el modelo ajustado en el nivel clase y el modelo ajustado en el nivel 
estudiante se obtiene el MODELO DE EFECTOS ALEATORIOS siguiente: 


RBij = boj+b1¡BA¡¡+ P2CP;¡+ B3AC;¡+ PaEP;¡+ sj (nivel 1) (5.23) 
boy = Yoo +YOLEE¡+uoj; D1j=Y10 + Yu EE;¡+ ur; (nivel 2) 
RBi¿ = Yo +Y0EE¡+Y1EA;j+Y20CPij+Y30CPij+ 
+ YVswEP¡¡+YyuEE¡x EA;¡¡++U0¡+Uu ¡EA;¡+ ej; (combinado) 


donde RB se considera una función de los efectos fijos media general (yoo), efecto principal de los EE 
(yo1), efecto principal de los EA (y10), efecto principal del CP (y20), efecto principal de la AC (y30), efecto 
principal nivel EP (y4p), e interacción cruzada entre los EE y los EA (y11), más los efectos aleatorios que 
representan la variabilidad que existe entre las clases (up;), entre los enfoques de aprendizaje a través 
de las clases (u] ;) y dentro de las clases (e; ;). 

En la salida 5.20 se exhiben los resultados obtenidos tras ajustar un modelo que incluía las varia- 
bles explicativas de nivel 1 y de nivel 2. En concreto, se constata que el EE no resultó estadísticamente 
significativo como efecto principal (yo1 = .783, P = .076), aunque sí lo hizo como efecto secundario, a 
través de su interacción con los EA (y = —1.403, P = .020). No obstante, los estudiantes instruidos por 
profesores que utilizan un EE centrado en el alumno obtienen un rendimiento promedio ligeramente 
superior (9.81) al de aquellos otros estudiantes instruidos por profesores que utilizan un EE centrado 
en el docente (9.03). Con respecto a la interacción conviene resaltar que, en términos de la fuerza de 
asociación entre los EA y RB, los profesores que utilizaban un EE centrado en el alumno diferían de los 
que utilizaban un EE centrado en el docente. En otras palabras, debido al efecto moderador ejercido 
por la variable EE, las diferencias de desempeño entre los estudiantes que utilizaban EA profundo y los 
que utilizaban un EA superficial era superior en aquellos profesores que utilizaban un EE centrado en 
el docente que en los que utilizaban un EE centrado en el alumno. 


SALIDA 5.20 
Ajuste del modelo de efectos aleatorios 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de varianza —-2487.2 4974.3 (10) 4994.3 5014.8 
Efectos aleatorios 
Parámetros Estimador E. típico Z de Wald P>|Z| 
TOO 0.688 0.240 1.920 .054 
711 0.805 0.417 2.399 .016 
a? 8.330 0.392 21.246 <.001 
Efectos fijos 
Fuentes de variación gl glo F P>F 
Intercepción 9.026 0.503 17.94 (84) <.001 
EE 0.783 0.434 1.81 (57) .076 
EA 2.903 0.520 5.58 (99) <.001 
CP 0.658 0.178 3.69 (79) <.001 
AC 0.111 0.025 4.46 (840) <.001 
EP 0.374 0.086 4.48 (902) <.001 
EExEA 1.403 0.589 -2.34 (106) .020 
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5.7. SUGERENCIAS DE ESTUDIO 


La técnica del ANCOVA es compleja y puede plantear graves problemas de interpretación si no se 
utiliza apropiadamente, incluso cuando se emplea, como es usual, con el apoyo de algún paquete esta- 
dístico profesional. Un pionero trabajo de Elashoff (1969) fue particularmente ilustrativo respecto de los 
peligros que entrañaba la interpretación de los resultados cuando era muy incipiente el uso de paquetes 
estadísticos. Un trabajo más reciente de Miller y Chapman (2001), todavía sigue planteando la necesidad 
de abandonar conceptualizaciones equivocadas y otro trabajo de Coolpepper y Aguinis (2011) alertaron 
sobre el peligro de utilizar covariantes medidas con error, lo que por cierto es muy usual en la investiga- 
ción psicológica. 

Hay excelentes introducciones al análisis de covarianza en textos clásicos de análisis de datos, diseño 
experimental y análisis multinivel. Especialmente recomendables son Hox (2010), Kutner et al. (2005), 
Maxwell y Delaney (2004), Pedhazur (1997), Raudenbush y Bryk (2002), Rutherford (2000), Tabachnik y 
Fidell (2013) y Snijders y Bosker (2012). La referencia más completa y apropiada para investigadores de 
Psicología es el texto de Huitema (2011), que se enfoca desde una perspectiva eminentemente concep- 
tual. Algo más avanzado es el segundo volumen de Milliken y Johnson (2002). 
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6.1. CONCEPTOS BÁSICOS 


6.1.1. Los tres pilares de la investigación en Psicología 


La investigación en las Ciencias del Comportamiento, las Ciencias Sociales y las Ciencias de la Salud 
se construye sobre tres pilares básicos (véase figura 6.1): la medida, el diseño y el análisis (Kline, 2011; 
Pedhazur y Smelkin, 1991). Cada uno de los pilares se asocia con alguno/s de los cuatro tipos de VALI- 
DEZ DE LA INVESTIGACIÓN definidos por Campbell y colaboradores (Campbell y Stanley, 1963; Cook y 
Campbell, 1979; Shadish, Cook y Campbell, 2002), que tratamos más adelante. 


— La MEDIDA se refiere a la identificación y definición de las variables (observables o latentes) objeto 
de investigación y la generación de datos empíricos (numéricos o categóricos) que son la entrada 
de los procedimientos de análisis estadístico. Es crítico que los datos empíricos tengan un alto 
grado de fiabilidad y de validez. El tipo de validez que se asocia con la medida es la VALIDEZ DE 
CONSTRUCTO, que se refiere a la capacidad de definir y operativizar apropiadamente las variables 
de una investigación. 


— El DISEÑO es un plan estructurado para abordar un problema de investigación con el objeto de 
obtener resultados rigurosos, libres de sesgo y generalizables, con el menor esfuerzo posible. As- 
pectos del proceso de investigación tales como la selección y asignación de las unidades experi- 
mentales, el control de potenciales variables extrañas y la reducción de la varianza de error son 
elementos esenciales del diseño. Dos tipos de validez determinan la calidad del diseño: la VALIDEZ 
INTERNA, que se refiere a la capacidad para controlar el efecto de variables extrañas que podrían 
confundir el efecto de las variables experimentales (o sea, variable/s independiente/s y variable/s 
dependiente/s), y la VALIDEZ EXTERNA, que se refiere a la capacidad para generalizar los resultados 
de la investigación a otros participantes, a otros contextos y a otros momentos temporales. 


— El ANÁLISIS concierne a la estimación de parámetros y la prueba de hipótesis estadísticas acerca 
del objetivo de investigación planteado. Pero es importante tener en cuenta que en el proceso de 
investigación la prueba de hipótesis no es lo primario. Actualmente se demanda mayor énfasis 
en la exactitud de la estimación que en la prueba de hipótesis y se valoran aspectos tales como la 
magnitud del efecto y la significación práctica y clínica de los resultados (Thompson, 2002a), en 
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línea con el enfoque analítico que fundamenta este texto, el MODELADO ESTADÍSTICO (Statistical 
Modeling). El tipo de validez que se asocia con el análisis es la VALIDEZ DE LA CONCLUSIÓN ES- 
TADÍSTICA, que se refiere al empleo correcto de los recursos estadísticos para obtener inferencias 
carentes de sesgo. 


Validez Validez 
interna externa 


Validez de la 
conclusión 
estadística 


Validez de 
constructo 


Figura 6.1 — Los tres pilares de la investigación en Psicología. 


Conviene resaltar el aspecto central que ocupa el pilar del diseño en la figura 6.1, al que dedicamos 
los restantes capítulos de este texto. En nuestra experiencia, muchos investigadores todavía conciben la 
investigación como una tarea analítica, más que como una tarea en la que están involucrados de forma 
sincronizada los tres pilares citados: primero la medida, después el diseño y finalmente el análisis. La 
expresión: "Tengo unos datos empíricos, ¿cómo los analizo?" ha sido y sigue siendo la cuestión formu- 
lada más frecuentemente a los expertos en metodología y análisis de datos. Pero, como muchas veces se 
ha respondido, una investigación no puede remediarse con un buen análisis estadístico si no fue apro- 
piadamente diseñada (you can fix by analysis what you bungled by design, —Light, Singer y Willett, 1990, 
p. viii—, o también, excellent methods of analysis will not salvage a poorly designed study —Rosenbaum, 
2010, p. ix—). En el mismo sentido podría argumentarse que la interpretación de los resultados de una 
investigación bien diseñada y bien analizada puede carecer de sentido si no se han utilizado variables 
medidas con un alto grado de fiabilidad y validez. Una investigación bien ejecutada debe comenzar re- 
solviendo la medida de las variables, para concentrarse después en el diseño y terminar finalmente con 
el análisis estadístico de los datos (véase Kline, 2009). 


6.1.2. Fases del proceso de investigación 


Siguiendo al profesor Arnau (1990, pp. 12-18), se describe el proceso de investigación distinguiendo 
tres fases o niveles en su aplicación, en correspondencia con las secciones del INFORME DE INVESTIGA- 
CIÓN recomendados por la APA (American Psychological Association), que suele ser finalmente objeto 
de evaluación anónima para su posible publicación en una revista especializada (véase cuadro 6.1). 
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— La primera fase corresponde al NIVEL TEÓRICO-CONCEPTUAL, donde se introduce el problema de 
investigación y se delimitan los objetivos e hipótesis (primarias y secundarias) susceptibles de 
comprobación empírica en relación con el marco conceptual donde se generó el problema (véase 
Draper, 2004). 


— La segunda fase es el NIVEL TÉCNICO-METODOLÓGICO, donde se describe el diseño de la investiga- 
ción, incluyendo la definición de las variables experimentales (independiente/s y dependiente/s) 
y de las variables extrañas o covariantes (observadas y no observadas), los procedimientos de con- 
trol de las variables extrañas, la selección y características de los sujetos participantes junto con 
el tratamiento ético de los mismos, el proceso de asignación de participantes a grupos, los instru- 
mentos usados y el procedimiento específico seguido para la recogida de los datos empíricos. Una 
precisa descripción de esta fase es esencial para evaluar externamente la metodología empleada 
y permitir a otros investigadores la replicación de la investigación. 


— La tercera fase es el NIVEL ESTADÍSTICO-ANALÍTICO, donde se utilizan los procedimientos descrip- 
tivos e inferenciales del análisis estadístico (enfoque NHST, Null Hypothesis Significance Testing) 
o se ajustan modelos estadísticos (enfoque del modelado estadístico) con el objeto de realizar 
inferencias de tipo causal o asociativo sobre los datos empíricos recogidos. La normativa APA re- 
comienda que, además de los resultados de las pruebas estadísticas para los efectos observados, 
se incluyan también medidas de magnitud del efecto, intervalos de confianza y una descripción 
(y a ser posible, tratamiento) de los datos perdidos (missing data). 


— Existe de hecho una última fase, que retorna de nuevo a la primera (el nivel conceptual), donde 
los resultados obtenidos se comparan con los objetivos planteados y la/s hipótesis (primarias y 
secundarias) de investigación, articulándolos dentro de la teoría que generó el problema. Es im- 
prescindible que la interpretación de los resultados tenga en cuenta las fuentes de sesgo y error, 
el control de las amenazas contra la validez, la precisión de las medidas empleadas, la valoración 
de los índices de magnitud del efecto usados y todas las limitaciones detectadas en el estudio. 


CUADRO 6.1 
Articulación del proceso y del informe de investigación 


Informe de investigación 
Proceso de investigación Sección Subsección 
Nivel teórico-conceptual Introducción | Problema 
Hipótesis 
Nivel técnico-metodológico | Método Variables 
Participantes 


Diseño 
Instrumentos 
Procedimiento 
Nivel estadístico-analítico Resultados Análisis descriptivo 
Análisis inferencial 
Nivel teórico-conceptual Discusión Discusión 


6.1.3. Estrategias para la investigación empírica en Psicología 


Los informes de investigación publicados en las revistas científicas de la Psicología y disciplinas afi- 
nes suelen clasificarse en tres grandes tipos: investigación teórica (p. ej., revisiones sustantivas y revisio- 
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nes metaanalíticas), investigación metodológica (p. ej., instrumentos de medida o desarrollo de nuevas 
metodologías) e investigación empírica (Ato, López y Benavente, 2013b; APA, 2011). Es esta última forma 
de investigación la que es objeto de atención en este texto. 

Pueden distinguirse tres estrategias claramente diferenciadas para realizar investigación empírica 
en Psicología: la ESTRATEGIA MANIPULATIVA, la ESTRATEGIA ASOCIATIVA y la ESTRATEGIA DESCRIPTIVA 
(véase Ato et al., 2013b, Light et al., 1990). Cada una de las estrategias se caracteriza por formular hi- 
pótesis específicas, por generar tipos de diseño determinados y por la consecución de cierto grado de 
control (véase cuadro 6.2). La estrategia manipulativa configura un conjunto de los diseños que son tí- 
picos de la investigación experimental, mientras que las estrategias asociativa (y descriptiva) conforman 
un conjunto de los diseños que son típicos de la investigación no experimental. 

Los diseños de investigación que se inspiran en la estrategia manipulativa utilizan alguna forma de 
hipótesis causal, que se formula genéricamente con el argumento 'X es la causa de Y ', y pueden ser de 
tres tipos: EXPERIMENTAL, CUASIEXPERIMENTAL y CASO ÚNICO. Las hipótesis causales requieren la defini- 
ción de al menos dos variables experimentales: una variable que se asume como causa (X) y otra varia- 
ble que se asume como efecto (Y). Obviamente hay otras variables (alternativamente llamadas terceras 
variables, variables extrañas, covariantes, confundidores o variables Z), que pueden ser observables o no 
observables y tener cierto grado de influencia sobre las dos variables básicas. El control de las terceras 
variables constituye uno de los objetivos primarios del diseño de investigación. 


CUADRO 6.2 
Estrategias para la investigación empírica en psicología 


Estrategia 


Hipótesis 


Grado control 


Tamaño muestral 


Diseños 


Manipulativa 


Causal 


Máximo 


Medio 
Grande 
Muy pequeño 


EXPERIMENTAL 
CUASIEXPERIMENTAL 
CASO ÚNICO 


Asociativa 


Covariación 


Medio 
Medio-Bajo 
Medio-Alto 


Medio-Grande 
Medio-Grande 
Grande/Muy grande 


COMPARATIVO 
PREDICTIVO 
EXPLICATIVO 


Descriptiva 


No existe 


Mínimo 


Pequeño 


OBSERVACIONAL 


SELECTIVO 


Muy grande 


Los diseños de investigación que se inspiran en la estrategia asociativa utilizan por el contrario algu- 
na forma de hipótesis de covariación, que se formulan con el argumento 'X se relaciona funcionalmente 
con Y ”. Pueden ser de tres tipos, en función de que el objeto de la relación funcional sea la comparación 
de grupos (diseños COMPARATIVOS), la predicción de comportamientos y/o la clasificación en grupos 
(diseños PREDICTIVOS) O la prueba de modelos teóricos (diseños EXPLICATIVOS), para su integración en 
una teoría subyacente. Aunque el análisis causal no suele ser posible en los diseños de la estrategia 
asociativa, en ciertas ocasiones algunos diseños comparativos y muchos diseños explicativos pueden 
facilitar el establecimiento de relaciones causa-efecto. 

En los diseños que se inspiran en la estrategia descriptiva en general no se formulan hipótesis (causa- 
les o de covariación), sino que se limitan a describir las características de las variables que son objeto de 
interés. Los dos grandes grupos de diseños incluidos dentro de la estrategia descriptiva son los diseños 
SELECTIVOS, que utilizan por lo general la encuesta como instrumento y la representatividad de las uni- 
dades respecto de la población de origen como fundamento metodológico, y los diseños OBSERVACIO- 
NALES, que emplean la observación como instrumento y el realismo como fundamento metodológico. 


1El nombre de diseños observacionales, que es usual en investigaciones de Psicología y Educación, es a todas luces ambiguo. En 
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Una dimensión diferencial entre estrategias y entre diseños de investigación es el grado de control 
que pueda establecerse sobre las variables ajenas a la relación bajo estudio, evitando la presencia de 
sesgos, desde la estrategia manipulativa, donde el grado de control es máximo, a la estrategia descriptiva 
donde el grado de control es mínimo o nulo. Hay numerosas técnicas de control al uso, que tratamos 
con mayor detalle en la sección 6.2.2. 

Y finalmente, aunque de forma aproximada, otra dimensión diferencial de interés concierne al ta- 
maño muestral utilizado. El diseño cuasiexperimental suele emplear tamaños muestrales grandes (más 
de 100 unidades), el diseño experimental tamaños muestrales medios (entre 30 y 100 unidades) y el di- 
seño de caso único tamaños muestrales pequeños (menos de 30 unidades, y en ciertas ocasiones incluso 
un único caso). Los diseños de la estrategia asociativa suelen emplear tamaños medio-grandes (de 50 
a más de 100 unidades), como sucede con los diseños comparativos y predictivos, o muy grandes (más 
de 250), como ocurre en la mayoría de los diseños explicativos. Los diseños de la estrategia descriptiva 
suelen utilizar o bien grupos de tamaño muy numeroso (más de 250 unidades) como en el caso de la 
mayoría de los diseños selectivos o bien grupos de tamaño pequeño (menos de 30 unidades) como en 
el caso de muchos diseños observacionales. 

Muchos de los diseños mencionados tienen versiones adaptadas para la investigación transversal 
(que utiliza comparaciones estáticas, realizadas sin perspectiva temporal) y versiones apropiadas para la 
investigación longitudinal (que utiliza comparaciones dinámicas, realizadas con perspectiva temporal). 


6.1.4. Unidad experimental, unidad de observación y unidad de muestreo 


Un papel clave en el proceso de investigación lo juega la UNIDAD EXPERIMENTAL, que es el elemento 
más pequeño al que puede asignarse un tratamiento. Por ejemplo, en una investigación donde se eva- 
lúa la eficacia de un nuevo fármaco, la unidad experimental podría ser la rata y el tratamiento el nuevo 
fármaco. Es obvio que se requieren al menos dos grupos de unidades experimentales, un grupo que re- 
cibe el tratamiento (también llamado GRUPO EXPERIMENTAL O GE) y otro que no lo recibe o al que se 
administra un fármaco alternativo (llamado GRUPO CONTROL O GO), y que la respuesta debe ser alguna 
medida de la eficacia del nuevo fármaco. En otra investigación donde se prueba el rendimiento de una 
nueva campaña publicitaria para dejar de fumar, la unidad experimental podría ser el individuo y el 
tratamiento la campaña publicitaria. En este caso se requieren también dos grupos de unidades experi- 
mentales (GE y GC), el primero de los cuales sería expuesto a la campaña publicitaria y el segundo no. 
Cada una de las diferentes unidades experimentales que recibe un determinado tratamiento constituye 
una RÉPLICA del tratamiento. 

La unidad experimental debe distinguirse de la UNIDAD DE OBSERVACIÓN, que es simplemente el 
elemento más pequeño sobre el que se registra (o se mide) la respuesta, y también de la UNIDAD DE 
MUESTREO, que es un elemento seleccionado de una población de origen. En muchas investigaciones 
aplicadas, unidad experimental y unidad de observación coinciden. Por ejemplo, en el estudio de la efi- 
cacia de la campaña publicitaria, si la conducta de dejar de fumar se registra en cada individuo, es lo 
mismo unidad experimental y unidad de observación. En otras investigaciones, por el contrario, la uni- 
dad de observación puede ser una parte de la unidad experimental o puede representar una medida de 
la unidad experimental en diferentes momentos temporales. Por ejemplo, en un estudio sobre la efica- 
cia del tipo de escuela (pública o privada) sobre el rendimiento en Matemáticas, la unidad experimental 


otras áreas de las Ciencias Experimentales, las Ciencias Económicas y las Ciencias de la Salud, el mismo nombre se emplea para 
referirse de forma general a los diseños que no emplean aleatorización, o sea, los diseños cuasiexperimentales y los diseños de 
caso único de la estrategia manipulativa y los diseños comparativos de la estrategia asociativa. 
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es la escuela, pero la unidad de observación sobre la que se registra el rendimiento es el alumno. En 
otro estudio sobre la destreza manual para realizar una tarea mecánica simple en varones y mujeres, 
la unidad experimental es el individuo (hombre o mujer), pero la unidad de observación donde se re- 
gistra la medida es la mano (izquierda o derecha) del individuo. Los dos casos citados son ejemplos de 
diseños transversales, pero el concepto se aplica también con diseños longitudinales. Así, en un estudio 
longitudinal sobre el temperamento en niños registrado trimestralmente durante el primer año de vida, 
la unidad experimental es nuevamente el niño en su conjunto pero la unidad de observación cambia 
dependiendo de la edad del niño en que se registra la medida de temperamento (p. ej., alos 3, 6, 9 y 12 
meses). En todos estos casos es importante separar la variación debida a las unidades experimentales 
de la variación atribuíble a las unidades de observación. 

En casos más complejos (p.e., diseños multinivel) la distinción entre unidad experimental y unidad 
de observación no siempre es tan clara. En estos casos suele hablarse de TAMAÑO DE LA UNIDAD EXPERI- 
MENTAL, que se refiere a la entidad de la unidad experimental utilizada en cada nivel de una jerarquía de 
diferentes entidades. En los ejemplos citados, puede distinguirse una unidad mayor o más grande (es- 
cuela en el primer ejemplo, individuo en el segundo, niño en el tercero), de la que es parte otra unidad 
más pequeña (alumno en el primer ejemplo, mano en el segundo, medida temporal del temperamento 
en el tercero). En un estudio educativo multinivel europeo, por ejemplo, puede hablarse de diferentes 
tamaños de unidad experimental, desde el más pequeño (p. ej., el alumno), a entidades agregadas de 
nivel superior (p. ej., aula, escuela, colegio, distrito, ciudad, comunidad autónoma, país, etc.). Es im- 
portante en estos casos distinguir la variación entre alumnos de la variación entre aulas, entre colegios, 
entre distritos, entre ciudades, etc., que pueden ser también componentes importantes de la variación 
total de la variable de respuesta que se pretende explicar. 


6.1.5. Lainferencia causal 


En las investigaciones que utilizan diseños de la estrategia manipulativa (diseños experimentales, 
cuasiexperimentales y de caso único) y también en algunos diseños de la estrategia asociativa (en par- 
ticular los diseños comparativos y explicativos), se realiza alguna forma de INFERENCIA CAUSAL, O Sea, 
se somete a prueba una hipótesis que asume una relación causa-efecto entre al menos un Tratamiento 
O programa de intervención (la supuesta causa) y una Respuesta (el supuesto efecto). La formulación 
de una hipótesis causal pretende ser válida para el conjunto de las Unidades experimentales pertene- 
cientes a una determinada población, y además tiene lugar en algún Contexto físico apropiado y en una 
Ocasión temporal determinada. El acrónimo T-R-U-C-O (Cochran, 1982) resume los elementos esen- 
ciales de este argumento: 


El Tratamiento (T) produce una Respuesta (R) 
con las Unidades (U), dentro del Contexto (C) y en la Ocasión (O) 


Los términos implicados en este acrónimo son CONSTRUCTOS TEÓRICOS, y por tanto no son susceptibles 
de manipulación directa. Los investigadores se ven obligados a trabajar con términos más tangibles a ni- 
vel empírico, denominados INDICADORES, que son el resultado de transcribir los constructos en opera- 
ciones que permitan su manipulación y/o su medida. Dos ejemplos típicos de constructos psicológicos 
utilizados en la formulación de hipótesis causales son los siguientes: 


— El nuevo programa de enriquecimiento cognitivo, ¿mejora las habilidades lingúísticas de niños de 
baja extracción social? (Universidad de Tel Aviv, 1982). 
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— La campaña publicitaria sobre el peligro del tabaco, ¿es efectiva para reducir el hábito de fumar 
en personas con alto nivel educativo que viven en grandes ciudades? (Universidad de California, 
1991). 


Cuando se diseña una investigación, los constructos T (el programa de enriquecimiento cognitivo en el 
primer ejemplo y la campaña publicitaria sobre el peligro del tabaco en el segundo) y R (habilidades lin- 
gúísticas en el primer ejemplo y reducción del hábito de fumar en el segundo) tienen que ser traducidos 
en operaciones susceptibles de manipulación (indicador £) y medida de la respuesta (indicador r). Este 
proceso de traducción se denomina OPERACIONALIZACIÓN. La investigación se realiza con una muestra 
de individuos perteneciente a una cierta población, cada uno de los cuales constituye una unidad expe- 
rimental. En el ejemplo 1), el constructo U lo representa la población de niños de baja extracción social; 
en el ejemplo 2), la población de personas de alto nivel educativo que viven en grandes ciudades. Ade- 
más, ambas investigaciones se diseñaron en un contexto cultural, social y económico diferente (Israel 
el primero y Estados Unidos el segundo) y tuvieron lugar en diferentes ocasiones temporales (en 1982 el 
primero y en 1991 el segundo). 

Una vez concluida la investigación, el investigador puede proceder a determinar si el efecto obser- 
vado puede atribuirse a la supuesta causa y hasta qué punto es generalizable el resultado. Para ello debe 
estimarse un EFECTO DE TRATAMIENTO, en el caso más simple, la diferencia media en la variable de res- 
puesta entre un GE, que recibe tratamiento y un GC, que no lo recibe. Finalmente, el investigador aplica 
los procedimientos inferenciales al uso para decidir si el efecto de tratamiento explica el supuesto efecto 
o bien se ha producido por azar. 

Los requisitos necesarios para que la inferencia realizada tenga sentido causal son tres (Bollen, 1989; 
Shadish et al., 2002; Kenny, 1979): 


1. ASOCIACIÓN: la causa debe presentar una relación funcional con el efecto (covariación entre causa 
y efecto); 


2. DIRECCIÓN: la causa debe preceder en el tiempo al efecto (precedencia temporal de la causa); 


3. AISLAMIENTO: deben excluirse otras explicaciones alternativas del efecto diferentes de la causa 
propuesta (ausencia de espuriedad). 


Actualmente existen dos enfoques alternativos para el estudio de la inferencia causal: el enfoque de 
Campbell, más arraigado en las Ciencias Sociales y del Comportamiento, y el enfoque de Rubin, más 
arraigado en las Ciencias Experimentales, las Ciencias Económicas y las Ciencias de la Salud (Shadish, 
2010, Shadish y Sullivan, 2012). Ambos enfoques persiguen el mismo objeto, en concreto, la estimación 
de efectos de tratamiento, pero la filosofía es netamente diferente, aunque también tienen algunos as- 
pectos compatibles. 


— El ENFOQUE CAUSAL DE CAMPBELL (Campbell y Stanley, 1963; Cook y Campbell, 1979; Shadish et 
al., 2002) se centra más en aspectos del diseño más conveniente para producir inferencias cau- 
sales válidas del efecto de tratamiento con un énfasis en la representatividad y la generalización, 
y su temática central es la teoría de la validez de la inferencia en sus diferentes formas (validez 
estadística, validez de constructo, validez interna y validez externa). 


— El ENFOQUE CAUSAL DE RUBIN (Imbens y Rubin, 2014; Rubin, 1986, 2004; Pearl, 2009) se centra más 
en aspectos del análisis estadístico más apropiado para estimar efectos de tratamiento insesgados 
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y su temática central es la teoría de los resultados potenciales. Los tres elementos claves del enfo- 
que de Rubin son las unidades experimentales, la exposición o no a tratamiento y los resultados 
potenciales observados. Siendo Y una variable de respuesta, Y (1) es el resultado potencial que se 
observaría si la unidad se expusiera al tratamiento (T = 1), e Y(0) es el resultado potencial que se 
observaría si la misma unidad no se expusiera a tratamiento (T = 0). El efecto de tratamiento es, 
para cada unidad, la diferencia entre ambos resultados potenciales, Y (1) — Y (0). Cuando el trata- 
miento se ha administrado, el investigador obtiene un resultado factual, pero no el otro, que en 
este contexto se denomina contrafactual. Toda la cuestión se centra en cómo estimar el resultado 
potencial que falta, y la forma más común consiste en calcular un efecto de tratamiento medio so- 
bre el conjunto de las unidades experimentales, algunas de las cuales se expusieron a tratamiento 
y otras no. 


Los dos enfoques se aplican a la investigación realizada con las estrategias manipulativa y asociati- 
va, pero el enfoque de Campbell se centra más en la estrategia manipulativa (diseños experimentales, 
cuasiexperimentales y caso único), mientras que el enfoque de Rubin encuentra su expansión en la es- 
trategia asociativa (en particular, los diseños comparativos). Shadish y Sullivan (2012) consideran un 
tercer enfoque a la inferencia causal, el ENFOQUE DE PEARL (véase Pearl, 2010) que se aplica también 
a investigación realizada con la estrategia asociativa, pero se centra más en los diseños predictivos y 
explicativos, en concreto los modelos de rutas (path models) y los modelos de ecuaciones estructurales 
(SEM models). 

Gran parte de la investigación que se practica en muchas áreas de la Psicología se alinea con el 
enfoque de Campbell, pero otras áreas de la Psicología de la Salud son más afines al enfoque de Rubin. 
Desde nuestro punto de vista, es importante para la investigación psicológica estrechar los lazos con 
el enfoque de Rubin, que concebimos más como un enfoque complementario al enfoque de Campbell 
que como un enfoque alternativo (véase Ato, Vallejo y Ato, 2014). 


6.2. EL EXPERIMENTO COMO MODELO DE INVESTIGACIÓN 


Tanto el enfoque causal de Campbell como el enfoque causal de Rubin coinciden en considerar que 
el EXPERIMENTO ALEATORIO en las Ciencias Sociales, O el ENSAYO CLÍNICO CONTROLADO en las Ciencias 
de la Salud, es el método de investigación más apropiado para analizar relaciones causa-efecto, por- 
que cumple con los tres requisitos de la inferencia causal (asociación, dirección y aislamiento). Como 
consecuencia, muchos diseños que no tienen naturaleza experimental porque no cumplen con los tres 
requisitos intentan, con mayor o menor éxito, reproducir en la medida de lo posible las condiciones del 
diseño experimental, convirtiéndolo así en un arquetipo de investigación eficiente. 

El diseño experimental típico posee dos propiedades distintivas esenciales, a saber: 


1. MANIPULACIÓN activa de (al menos) una variable independiente por parte del investigador. La 
manipulación se entiende como facultad del investigador para variar a voluntad los niveles de 
tratamiento (programa o intervención) que representa la variable independiente. 


2. ALEATORIZACIÓN, o utilización de una REGLA DE ASIGNACIÓN ALEATORIA para distribuir las unida- 
des experimentales entre los niveles de tratamiento, evitando la presencia de sesgos. 


Algunos diseños de la estrategia manipulativa, en concreto los diseños cuasiexperimentales y los dise- 
ños de caso único, cumplen con la primera de las propiedades, pero no con la segunda. Los diseños de la 
estrategia asociativa, y particularmente los diseños comparativos, no cumplen con ninguna de las dos. 
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Para profundizar en las diferencias entre diseño experimental, cuasiexperimental y no experimental, 
Judd y Kenny (1981a) han distinguido entre tres diferentes REGLAS DE ASIGNACIÓN de unidades experi- 
mentales a los tratamientos: 


— Regla de asignación aleatoria: las unidades experimentales se asignan al azar a los grupos. En 
esta situación se asume que los diferentes grupos de unidades que reciben los tratamientos son 
equivalentes antes de administrar el tratamiento. 


— Regla de asignación no aleatoria, pero sí conocida: las unidades experimentales se asignan a los 
tratamientos en función de una puntuación de corte (p.e., la puntuación obtenida en un pretest). 
En este caso, los grupos no se asumen iguales, pero la probabilidad de asignación de unidades 
experimentales, y por ende las diferencias iniciales entre los grupos, se conoce perfectamente. 


— Regla de asignación no aleatoria ni conocida: no se conoce, ni puede conocerse con exactitud, 
cómo difieren entre sí los grupos de unidades antes de administrar el tratamiento. 


Estas reglas asumen la existencia de una VARIABLE DE ASIGNACIÓN, que representa una probabilidad 
conocida e igual para todas las unidades experimentales (o sea, una constante) en el caso (a), una pun- 
tuación de corte que representa la pertenencia a grupo (o sea, una variable binaria) en el caso (b) y una 
variable extraña desconocida en el caso (c). 

La asignación aleatoria se aplica en una etapa que no debe confundirse con una etapa previa, donde 
se aplica la SELECCIÓN ALEATORIA de unidades experimentales de una población de referencia. Ambas 
etapas se ilustran en el diagrama de la figura 6.2. Aunque se recomienda la aplicación de las dos etapas 
aleatorias en la investigación experimental, la selección aleatoria se emplea sólo para extraer al azar un 
conjunto de unidades experimentales de una población, mientras que la asignación aleatoria se utiliza 
para distribuir al azar las unidades entre los dos grupos. Con la primera se persigue que las unidades ex- 
perimentales sean representativas de su población de origen, objetivo fundamental de los diseños selec- 
tivos, y afecta en lo fundamental a la validez externa de la investigación, pero no es común su aplicación 
en diseños experimentales. Con la segunda se persigue que las unidades experimentales se distribuyan 
aleatoriamente entre los grupos para asegurar la igualdad de los grupos antes de la administración del 
tratamiento, evitando así los SESGOS DE SELECCIÓN, objetivo primario del diseño experimental, y afecta 
en lo fundamental a la validez interna. 


ASIGNACION 
SELECCIÓN ALEATORIA (6) Grupo 
ALEATORIA (A) l experimental 
Población 
Grupo de 
control 


Figura 6.2. — Proceso de selección aleatoria (A) y de asignación aleatoria (B). 
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La fortaleza del diseño experimental y su justificación como modelo de referencia (gold standard) 
en la investigación aplicada es, por tanto, la utilización de una regla de ASIGNACIÓN ALEATORIA para 
distribuir las unidades experimentales entre los tratamientos. En el diseño experimental más simple, 
donde sólo hay un grupo de unidades experimentales que recibe tratamiento (GE) y otro grupo que no 
lo recibe (GC), la asignación aleatoria de unidades experimentales al GE y GC reparte de forma homo- 
génea las unidades experimentales entre los dos grupos antes de la administración del tratamiento. Co- 
mo consecuencia, es bastante probable (en particular si se dispone de un tamaño muestral numeroso) 
equilibrar los grupos en todas las variables extrañas, observables o no observables. Éste es un contexto 
óptimo para estimar efectos de tratamiento libres de sesgo sistemático. 

Por el contrario, los diseños que no emplean aleatorización suelen presentar SESGO DE SELECCIÓN, 
que es una forma de sesgo sistemático producido por la existencia de grupos no iguales antes de ad- 
ministrar el tratamiento. Como consecuencia, el efecto de tratamiento puede estar afectado por la in- 
fluencia de variables extrañas, relacionadas con X y con Y, que confunden la relación objeto de inves- 
tigación. Conviene no obstante notar que esta situación también puede ocurrir cuando no se cumplen 
las condiciones de regularidad de los diseños experimentales, por ejemplo, cuando se produce morta- 
lidad experimental (attrition), o falta de conformidad con el tratamiento por parte de los participantes 
(treatment noncompliance). 


6.2.1. Elproblema del confundido 


El problema esencial que se plantea en investigaciones donde los grupos presentan sesgo de selec- 
ción, en contraste con las investigaciones donde no hay sesgo de selección, es el problema del CONFUN- 
DIDO, o sea, la intromisión del efecto de una variable extraña (p. ej., Z) en una relación aparentemente 
estable entre una supuesta causa y un supuesto efecto, X — Y. El efecto de Z puede sustituir al efecto 
de X para explicar Y, confundiendo la relación estudiada, o puede incluso actuar conjuntamente con 
X, conduciendo a una interpretación errónea de la relación original. Esta situación está provocada por 
la existencia de variables extrañas no controladas relacionadas con X y/o con Y. Si el investigador no 
tiene conocimiento de ellas, la interpretación del efecto puede resultar confundida. El confundido pue- 
de tener mayor o menor gravedad en función de si las variables extrañas son observables y medibles, 
y como consecuencia susceptibles de control, o no son observables o medibles, en cuyo caso su efecto 
resulta difícil de controlar. 

La figura 6.3 (adaptada de Pedhazur y Smelkin, 1991, p. 280) compara las dos situaciones de investi- 
gación, experimental (los grupos se forman mediante aleatorización) y no experimental (los grupos se 
forman sin aleatorización), con un modelo de regresión. El primer caso (izquierda) ilustra una situación 
propiamente experimental, donde el efecto de tratamiento (Py. x) explica una proporción de la variable 
dependiente (Y), dejando otra parte no explicada, representada por los residuales del modelo (ey x). Es- 
ta situación refleja una partición objetiva e independiente de la variación, ya que se verifica el supuesto 
de INDEPENDENCIA ENTRE LOS RESIDUALES Y LA VARIABLE INDEPENDIENTE (véase capítulo 2, sección 
2.6). El segundo caso (derecha) ilustra una situación no experimental donde el efecto de tratamiento 
explica también una proporción de la variable dependiente, pero el efecto se asume sesgado porque la 
partición no es objetiva e independiente, ya que se incumple el supuesto de independencia entre los 
residuales y la variable independiente (la dependencia se representa mediante la correlación px. en el 
diagrama). Cuando se especifica un modelo que incumple alguno de los supuestos que debe satisfacer 
se produce un ERROR DE ESPECIFICACIÓN (véase capítulo 1, sección 1.2.3), conduciendo a estimaciones 
sesgadas del efecto de tratamiento y, por ende, a una SITUACIÓN DE CONFUNDIDO. Esta situación parti- 
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cular se genera siempre que en la especificación del modelo se omiten variables relevantes relacionadas 
con la variable independiente, algo extremadamente común en la investigación en Psicología. 


e e 
Pxe 
€. 
Y.X e, x 
B, X Bix 
>. a de. AR => Y 
EXPERIMENTAL NO EXPERIMENTAL 


Figura 6.3. — Dos situaciones de investigación: experimental (izquierda) y no experimental (derecha) 


Nlustramos la situación de confundido con una investigación no experimental de tipo predictivo. El 
cuadro 6.3 presenta los resultados (ficticios) de un estudio realizado en un punto negro con limitación 
de velocidad a 60 Km/h., donde se registraron los 100 primeros accidentes que tuvieron lugar en él, 
observando si se había producido la muerte del conductor (instantánea o demorada) o bien había re- 
sultado vivo (o con lesiones compatibles con la vida). Las dos variables básicas son el uso del cinturón 
(Z) y el Estado del conductor (Y), que se midió calculando un indicador del estado, la tasa de mortalidad 
(TM), definida como el número de accidentes con resultado de muerte respecto del total de accidentes 
registrados. 


CUADRO 6.3 
Uso del cinturón de seguridad y estado del conductor 


Uso del Estado del conductor (Y) | Tasa de 
cinturón (X) | Muerto | Vivo | Total mortalidad 


SÍ 6 54 60 6/60=0.100 
NO 9 31 40 9/49=0.225 
15 85 15/10=0.150 


Observe que la tasa de mortalidad para quienes conducían con cinturón fue TM(SI) = 0.100, mien- 
tras que para quienes lo hacían sin cinturón fue TM(NO) = 0.225. Estos resultados permitirían concluir 
al investigador que es 2.25 veces más probable un accidente con consecuencias fatales cuando se con- 
duce sin cinturón que cuando se conduce con cinturón, asignando sentido a la relación entre X e Y 
(cuando se conduce sin cinturón es más probable que un accidente sea mortal). 

Sin embargo, esta interpretación presenta serias deficiencias. En primer lugar, la variable Uso del 
cinturón (X) no parece ser una auténtica variable causal, aunque indudablemente presenta una mode- 
rada correlación con la variable Estado del conductor (Y). En segundo lugar, el modelo representado en 
el cuadro 6.3 no contempla la existencia de otras variables extrañas que puedan explicar el estado del 
conductor después de un accidente, además del uso del cinturón. O sea, se está empleando el diagrama 
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de la izquierda de la figura 6.3, asumiendo independencia entre residuales y X, y por tanto excluyen- 
do la posibilidad de que otras variables puedan afectar a la relación. Sin embargo, una de las variables 
extrañas más relevantes en este contexto podría ser la Velocidad del vehículo (2), que también podría 
explicar la tasa de mortalidad encontrada. Afortunadamente, es muy fácil conseguir una estimación de 
esta variable si se tiene acceso a los registros policiales. Una reordenación de los datos del cuadro 6.3 
para incluir esta nueva variable se presenta en el cuadro 6.4. 


CUADRO 6.4 
Uso del cinturón, velocidad del vehículo y estado del conductor 


Uso del Estado del conductor (Y) Tasa de 

Velocidad del vehículo (Z) | cinturón (X) | Muerto | Vivo | Total mortalidad 
Menos de 100 Km/h sÍ 53 2/55=0.036 
Menos de 100 Km/h NO 29 1/30=0.033 


3/85=0.035 
Más de 100 Km/h SÍ 4/5=0.800 
Más de 100 Km/h NO 2 8/10=0.800 
12/15 = 0.800 


El resultado obtenido es ahora bien diferente. Cuando se circula a menos de 100 Km/h, la TM es 
prácticamente despreciable (TM < .0050), y además es constante, es decir, es la misma independiente- 
mente de que se lleve o no cinturón de seguridad. Sin embargo, cuando se circula a más de 100 Km/h, 
la TM es muy alta (TM = 0.800), y además es también constante, independientemente de que se lleve 
o no cinturón de seguridad. En consecuencia, parece oportuno concluir que la Velocidad del vehícu- 
lo (Z) es una variable relevante para explicar el Estado del conductor (Y) y que el Uso del cinturón (X) 
es una variable irrelevante, porque su efecto es el mismo a una velocidad constante del vehículo. És- 
te es un caso ilustrativo de una regla general en metodología de la investigación que argumenta que 
la correlación no prueba la causación. En este contexto se dice que la relación entre X e Y es una RE- 
LACIÓN ESPURIA, O similarmente una RELACIÓN DE CONFUNDIDO, porque aparentemente la relación 
X — Y existe cuando no se tiene en cuenta Z, pero se difumina o desaparece cuando se tiene en cuenta 
Z. En la situación de confundido ilustrada aquí, la confusión se ha producido como consecuencia de la 
omisión de una variable relevante. En el contexto de la relación estudiada, la variable omitida se dice 
que es un VARIABLE ESPURIA O CONFUNDIDOR. 


6.2.2. Técnicas de control de variables extrañas 


La sección anterior apunta que una de las mayores dificultades de la investigación aplicada es la de- 
tección de terceras variables (que hemos denominado alternativamente variables extrañas, variables Z, 
confundidores o variables espurias) con el objeto de controlarlas para obtener efectos de tratamiento 
carentes de sesgo. Es esencial para conseguir este objetivo el control de todas las fuentes de variación 
no deseadas que representan las terceras variables. Hay una abundante cantidad de variables extrañas 
que pueden estar presentes en una investigación (p. ej., las instrucciones que se dan a los participantes 
pueden no ser exactamente iguales, la calibración de un instrumento de medida puede cambiar duran- 
te el curso de un experimento, algunos participantes no responden al tratamiento, y un largo etcétera). 
En ocasiones el efecto de una variable extraña puede distorsionar sistemáticamente los resultados en 
un grupo/tratamiento respecto de otro, produciendo entonces sesgo sistemático, y en otras ocasiones 
puede afectar a la variación de la variable dependiente incrementando la varianza de error, o sea, la 
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variación no atribuible al efecto de la/s variable/s independiente/s. Sesgo sistemático y error aleatorio 
pueden incluso actuar de forma combinada, generando el peor de los escenarios posibles para interpre- 
tar un efecto de tratamiento. De ahí la importancia de que el investigador sepa reconocer la presencia 
de confundidores e introduzca técnicas de control apropiadas para corregir sus efectos. 

Las técnicas de control de variables extrañas difieren en función de si los efectos de tratamiento 
tienen naturaleza transversal (o sea, se estiman en una ocasión temporal determinada), o longitudinal 
(o sea, se estiman a lo largo del tiempo). La figura 6.4 es un diagrama de algunas de las técnicas de 
control más frecuentemente usadas en la investigación psicológica (Ato, 1991). 

Hay tres técnicas básicas de control de naturaleza transversal: la ELIMINACIÓN de una variable ex- 
traña, que consiste simplemente en suprimirla de la situación experimental (p. ej., el control del ruido 
utilizando cabinas libres de ruido), la CONSTANCIA, que implica emplear un único nivel de la variable ex- 
traña (p. ej., el control de la variable sexo empleando sólo mujeres o sólo varones), y la EQUILIBRACIÓN, 
cuyo objeto es distribuir el efecto de las variables extrañas entre los grupos. El principal inconveniente 
de las dos primeras es que pueden reducir la generalizabilidad de los efectos de tratamiento. 


Eliminación 
Constancia 
Aleatorización 
Individual 
Control EE. G | 
s E ; e Emparejamiento rupa 
xperimenta , 
Fansvensales P Puntuaciones 
Ah ¡6 de propensión 
Equilibración Bloqueo prop 
6 Residualización 
ontro! y mE 
Estadístico Ajuste de regresión (ANCOVA) 
Técnica de variables instrumentales 
Intrasujeto 
Longitudinales 4 Contraequilibracióng Intragrupo 
Aleatoria 


Figura 6.4. — Técnicas de control de variables extrañas. 


La equilibración es la técnica de control más común para corregir o reducir el SESGO DE SELECCIÓN, 
o sea, la existencia de grupos no iguales antes de comenzar el tratamiento. Hay dos formas básicas para 
intentar igualar el efecto de las variables extrañas entre los grupos: mediante el CONTROL EXPERIMENTAL, 
que son un amplio conjunto de técnicas que se introducen durante la etapa de diseño de la investiga- 
ción, o mediante el CONTROL ESTADÍSTICO, que son técnicas de control que se introducen durante la 
etapa de análisis estadístico de los datos. 

La más importante técnica de control experimental es la ALEATORIZACIÓN, que se asume tanto más 
efectiva cuanto mayor es el tamaño muestral y más objetiva es la forma concreta de aplicarla. Repre- 
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senta, como tratamos anteriormente, uno de los dos requisitos básicos para considerar un diseño como 
experimental. En el caso ideal, su principal virtud es la distribución de todas las variables extrañas (ob- 
servadas y no observadas) entre los grupos de tratamiento, no afectando diferencialmente a un grupo 
respecto de otro. Su principal desventaja es que la composición de los grupos mediante aleatorización 
usualmente genera grupos de participantes muy heterogéneos. 

Desgraciadamente, para muchos problemas de investigación no es aplicable o no es ético aplicar la 
técnica de aleatorización. Si el investigador conoce qué variables extrañas pueden estar interviniendo 
en tales casos, hay dos técnicas de control por equilibración que pueden acaparar su atención para 
intentar reducir el error aleatorio y minimizar el sesgo sistemático, a saber: 


— La técnica del BLOQUEO, que consiste en formar conjuntos homogéneos de participantes para 
cada uno de los niveles de al menos una variable extraña y asignarlos después (de forma aleatoria 
o no aleatoria) a las condiciones de tratamiento dentro de cada bloque. Esta acción produce como 
resultado la introducción de la variable extraña (categorizada) como un nuevo factor en el diseño 
de investigación. Si la asignación de participantes de un conjunto homogéneo a los grupos es 
aleatoria el diseño será experimental; si no es aleatoria, el diseño será cuasiexperimental (siempre 
que sea el experimentador quien defina la naturaleza de los grupos) o comparativo (si los grupos 
ya se han definido y el experimentador no tiene control alguno sobre su producción). 


— La técnica del EMPAREJAMIENTO, que trata de conseguir, disponiendo de una muestra de partici- 
pantes para un grupo (p. ej., el GE), participantes con las mismas características en un conjunto de 
variables extrañas para asignarlos a otro/s grupo/s (p. ej., un GC). El emparejamiento es la técnica 
de control experimental más versátil, porque se puede practicar tanto de forma individualizada (o 
sea, emparejando caso a caso para formar los grupos) como de forma grupal o generalizada (o sea, 
emparejando los grupos en su conjunto). Una forma de emparejamiento que ha demostrado ma- 
yor efectividad para reducir el sesgo de selección es el EMPAREJAMIENTO MEDIANTE PUNTUACIO- 
NES DE PROPENSIÓN, una técnica escasamente utilizada en Psicología (Shadish, Luellen y Clark, 
2006), donde la condición para emparejar casos es alcanzar valores similares en las puntuacio- 
nes de propensión estimadas para una gran selección de variables extrañas observables (Austin, 
2011; Guo y Fraser, 2010; Luellen, Shadish y Clark, 2005; Rosenbaum y Rubin, 1983, Rubin, 2001). 
Las puntuaciones de propensión suelen estimarse mediante regresión logística y pueden tomar 
cualquier valor comprendido entre 0 y 1. Si se estimaran las puntuaciones de propensión en un 
diseño experimental, cada uno de los participantes tendría una puntuación de 0.50, pero en un 
diseño cuasiexperimental o comparativo los valores se desvían de 0.50. Sin embargo, cuando un 
participante del GE tiene la misma puntuación de propensión que uno del GC, puede inferirse 
que las variables extrañas utilizadas en la ecuación de regresión logística han sido controladas. 


Sin embargo, a veces el control experimental no es posible o no se ha podido conseguir un control 
efectivo. Cuando se utilizan grupos naturales, la única forma de emparejamiento posible es el EMPA- 
REJAMIENTO POST-HOC (0 sea, la constitución de un grupo de control una vez que el tratamiento ha 
tenido lugar). Como alternativa al control experimental, el CONTROL ESTADÍSTICO persigue el mismo 
objetivo que la equilibración, pero utilizando procedimientos estadísticos para ajustar la desigualdad 
entre los grupos de tratamiento. En general, las técnicas de control estadístico se consideran inferiores 
alas técnicas de control experimental en términos de efectividad y muchas de ellas se basan en supues- 
tos estadísticos que no siempre se cumplen, pero son la única opción viable si el control experimental 
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no fuera efectivo. Las técnicas de control estadístico más relevantes son la residualización, el ajuste de 
regresión (ANCOVA) y la técnica de las variables instrumentales. 


— Una técnica simple de control estadístico, que es típica de los diseños predictivos pero se emplea 
también con diseños cuasiexperimentales y comparativos, es la RESIDUALIZACIÓN, que consiste 
en controlar la influencia de al menos una variable extraña conocida eliminando de la variable 
de respuesta lo que explica la variable extraña. Se practica comúnmente con los coeficientes de 
correlación (y determinación) parcial y semiparcial que tratamos en el capítulo 2. Por ejemplo, 
RE: x.y es el coeficiente de determinación parcial entre X e Y una vez que se ha eliminado de X y 
de Y el efecto de Z, y na x.z) es el coeficiente de determinación semiparcial entre X e Y una vez 
eliminado de X, pero no de Y, el efecto de Z. La idea se generaliza a más de una variable extraña. 


— La técnica de control estadístico más usada es, sin embargo, el AJUSTE DE REGRESIÓN MEDIANTE 
ANCOVA, que consiste en introducir una (o más) variable/s extraña/s de naturaleza numérica 
(continua o discreta), con el objeto de controlar su efecto eliminando la varianza que explica de la 
variable de respuesta. La selección de las variables extrañas y su relevancia como variables de con- 
trol son la cuestión crucial para que este procedimiento sea efectivo. Sin embargo, es una técnica 
muy versátil porque se puede aplicar en cualquier contexto y con cualquier diseño de investiga- 
ción (incluso admite como covariante las puntuaciones de propensión). 


— Una técnica de control estadísticamente compleja, que es apropiada cuando se sospecha que 
el confundido está producido por variables extrañas no observables, es la técnica de las VARIA- 
BLES INSTRUMENTALES, originalmente propuesta por economistas, y difundida en algunas áreas 
de las Ciencias de la Salud (véase Brookhart, Rassen y Schneeweiss, 2010; Heckman, 1997; Rassen, 
Brookjart, Glynn, Mittleman y Schneeweiss, 2009, y Winship y Morgan, 1999), pero no en Psicolo- 
gía. El análisis con variables instrumentales permite estimar efectos de tratamientos insesgados 
cuando las variables extrañas correlacionan con el término de error (véase el diagrama de la dere- 
cha de la figura 6.3), o sea, en presencia de un error de especificación por omisión de alguna va- 
riable relevante. La técnica consiste en identificar una variable natural, relacionada directamente 
con el tratamiento (pero sólo indirectamente con la respuesta) y utilizarla después como una va- 
riable delegada (proxy) que sustituye a la variable de tratamiento confundida para estimar efectos 
de tratamiento. 


Cuando los efectos de tratamiento tienen naturaleza longitudinal, la preocupación por la igualdad 
de los grupos no suele ser un problema, por tratarse de los mismos participantes, y las técnicas de con- 
trol persiguen controlar los efectos típicos de la investigación longitudinal, a saber, los EFECTOS DE 
SECUENCIACIÓN. Hay dos tipos de efectos de secuenciación, los EFECTOS DE ORDEN O DE ERROR PRO- 
GRESIVO (order effects) y los EFECTOS DE TRANSFERENCIA (carry-over effects). Los efectos de orden son 
extrínsecos al sujeto, se presentan siempre que los tratamientos se administran en el mismo orden a 
las unidades experimentales y pueden tener consecuencias positivas (p. ej., el EFECTO DE PRÁCTICA) O 
negativas (p. ej., el EFECTO DE FATIGA). Los efectos de transferencia son intrínsecos al sujeto y por ello 
son más difíciles de controlar. Otras variables extrañas que pueden generar confundido son los EFECTOS 
DE LA INFLUENCIA ESPACIAL Y TEMPORAL, que se presentan cuando se limita el tiempo requerido para 
completar una prueba, el momento del día en que se administra o el lugar donde se realiza. 

En todos estos casos, la técnica de control más apropiada es una forma de equilibración adaptada a 
la naturaleza longitudinal de los efectos de tratamiento. Se denomina CONTRAEQUILIBRACIÓN, y puede 
adaptar tres formas básicas: 
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— La CONTRAEQUILIBRACIÓN INTRASUJETO se propone controlar los efectos de secuenciación em- 
pleando, para cada unidad experimental, una secuencia que incluya todos los órdenes posibles (p. 
ej., asumiendo dos tratamientos A y B, la contraequilibración intrasujeto asignaría a cada sujeto 
la secuencia A— B— B-— A). El inconveniente principal es su aplicación cuando hay que controlar 
una secuencia de 3 o más tratamientos. 


— La CONTRAEQUILIBRACIÓN INTRAGRUPO se propone por el contrario controlar los efectos de se- 
cuenciación utilizando todos los órdenes posibles de la secuencia de tratamientos. Por ejemplo, 
si hay 3 tratamientos (4, B y C), la CONTRAEQUILIBRACIÓN INTRAGRUPO COMPLETA consiste en 
asignar a diferentes unidades experimentales las 3! = 6 secuencias siguientes: A—-B-C, A-C-B, 
B-A-C, B-C-A, C-A-ByC-B- A, mientras que la CONTRAEQUILIBRACIÓN INTRAGRU- 
PO INCOMPLETA asignaría solo tantas secuencias como número de tratamientos existan en una 
disposición denominada CUADRADO LATINO (p. ej., las secuencias A—-C—B, B-A-CyC-B-A). 


— La CONTRAEQUILIBRACIÓN ALEATORIA €s la forma de control más recomendable para los efectos 
de secuenciación y consiste en emplear, para cada unidad experimental, una de las posibles se- 
cuencias seleccionada al azar. 


6.3. VALIDEZ DE LA INVESTIGACIÓN 


La ventaja de la investigación experimental es la creación de unas condiciones óptimas para posibi- 
litar la inferencia causal. Su debilidad fundamental es el grado en que se puede generalizar tal inferen- 
cia. Otras alternativas a la investigación no experimentales se proponen lograr el máximo acercamiento 
posible a las propiedades de la investigación experimental. Para valorar la calidad de la inferencia y el 
grado de generalización de la misma, Shadish et al. (2002), desarrollando ideas inicialmente planteadas 
por Campbell y Stanley (1963, 1966), y posteriormente elaboradas por Cook y Campbell (1979), propu- 
sieron un esquema de la VALIDEZ DE LA INVESTIGACIÓN que distingue cuatro tipos de validez, los dos 
primeros relacionados con la validez de la inferencia causal y los dos últimos con la generalización de la 
inferencia. El esquema de la validez se articula con los tres pilares que consideramos en la sección 6.1 en 
torno a las mismas cuestiones que un investigador debe plantearse cuando realiza una investigación. 


1. Validez de la conclusión estadística: ¿Existe una relación funcional entre tratamiento/programa 
(causa) y respuesta (efecto)? 


2. Validez interna. Suponiendo que tal relación exista, ¿es realmente el tratamiento/programa la cau- 
sa de la respuesta o existen otras causas alternativas que podrían haber producido la respuesta? 


3. Validez de constructo. Suponiendo que la relación existe y que el tratamiento es la única causa 
de la respuesta, ¿cuáles son los constructos implicados en la relación estudiada?, ¿qué relación 
mantienen con los indicadores utilizados?, ¿en qué medida tales indicadores son representativos 
de sus respectivos constructos? 


4. Validez cxterna. Y finalmente, suponiendo que la relación existe, que no hay causas alternativas 
del efecto diferentes de la causa y que los indicadores representan adecuadamente a sus cons- 
tructos respectivos, ¿en qué medida puede generalizarse la inferencia causal a otros tratamientos, 
respuestas, unidades experimentales, contextos, indicadores de medida y ocasiones diferentes? 
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Tiene interés considerar un análisis detenido de cada uno de los cuatro tipos de validez. Con esta 
finalidad las AMENAZAS CONTRA LA VALIDEZ son situaciones comunes de la investigación aplicada en las 
que pueden encontrarse confundidores conocidos, donde los investigadores suelen cometer errores al 
realizar inferencias causa-efecto, o donde se emplean constructos e indicadores de forma inapropiada. 

La principal virtud que se atribuye al esquema elaborado en la tradición de Campbell (Shadish et 
al., 2002) es su visión generalista del complejo entramado de la metodología de la investigación, cuyo 
conocimiento capacita para comprender los principios del diseño de investigación en Psicología. 


6.3.1. Validez de la conclusión estadística 


La VALIDEZ DE LA CONCLUSIÓN ESTADÍSTICA se refiere esencialmente a dos inferencias estadísticas 
relacionadas que pueden afectar a la relación entre las supuestas variables causa y efecto, en concreto: 
1) ¿covarían las variables causa y efecto?, y 2) en caso de que covaríen, ¿cuál es la magnitud empírica 
de su covariación? Para la primera de las inferencias, se puede concluir de forma incorrecta que causa 
y efecto covarían cuando de hecho no covarían (en cuyo caso se comete un ERROR TIPO ID) o concluir 
también incorrectamente que no covarían cuando de hecho sí lo hacen (en cuyo caso se comete un 
ERROR TIPO II). Para la segunda de las inferencias, al obtener una estimación de la covariación, se puede 
subestimar o sobreestimar la magnitud de la covariación. 

El medio más establecido de determinar si causa y efecto covarían es el CONTRASTE DE HIPÓTESIS, 
donde se compara una hipótesis nula contra una hipótesis alternativa y se determina mediante una 
prueba estadística la probabilidad de rechazar la hipótesis nula bajo el supuesto de que es verdadera. 
Por ejemplo, si se desea utilizar la prueba de £ para determinar si difieren las medias empíricas de dos 
grupos (GE y GO), la hipótesis nula establece que la diferencia entre las medias es nula en la población 
de donde tales medias empíricas se han extraido. La prueba produce un valor empírico del estadístico 
t (que se asume distribuido según una distribución £ de Student), y se acompaña de un argumento 
de probabilidad (por ejemplo, p = .015), que es la probabilidad de que una diferencia absoluta entre 
medias como la empíricamente obtenida haya ocurrido por azar en una población donde se asume que 
la diferencia es nula. Siguiendo una sugerencia de Fisher (1926), es común describir este resultado de 
forma dicotómica, es decir, como estadísticamente significativo si p < .05 (como sucede en el caso que 
comentamos), o estadísticamente no significativo si p > .05, dado un criterio prefijado de a =.05. Del 
mismo modo se decide con otros criterios comúnmente aceptados (por ejemplo, el criterio q =.01). 

Una larga controversia ha existido en torno a las pruebas de significación, y la elección de los cri- 
terios del .05 y del .01 para aceptar o rechazar hipótesis nulas es usual dentro del enfoque NHST (Null 
Hypothesis Significance Testing”). Pero en lugar de presentar un argumento de significación basado en 
criterios establecidos, actualmente se prefiere presentar los resultados bajo la forma de tamaños de efec- 
to e intervalos de confianza en torno a los estimadores de los parámetros y los tamaños del efecto. Un 
tratamiento alternativo al enfoque NHAST al que nos hemos adherido en este texto es el enfoque SM, 
(Statistical Modeling), que consiste en la formulación y ajuste de modelos de probabilidad a los datos 
empíricos. En lo que concierne al análisis de datos, este enfoque se desarrolla en los primeros cinco 
primeros capítulos del texto y lo aplicamos en los siguientes capítulos al diseño de investigación. 

Cabe notar que la conclusión estadísticamente significativo es un argumento que sólo hace referen- 
cia a la probabilidad de una hipótesis, pero no a la relevancia práctica del resultado obtenido. Todas 
las pruebas estadísticas se construyen utilizando como numerador la diferencia observada (en el caso 
más simple, una diferencia de medias) y como denominador el error típico de la diferencia. En gene- 
ral, cuanto mayor sea la diferencia observada mayor será la probabilidad de ser significativa, pero la 
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conclusión depende también del error típico, que a su vez depende del tamaño muestral. Si el tamaño 
muestral es pequeño, el error típico tiende a ser grande y más grande habrá de ser la diferencia entre 
medias para resultar significativa; si el tamaño muestral es grande, el error típico tiende a ser pequeño y 
más pequeña será la diferencia entre medias para resultar significativa. No es aconsejable fundamentar 
la interpretación de los resultados de investigación en su significación estadística, ya que pueden obte- 
nerse resultados significativos con diferencias de escasa importancia científica o práctica y resultados 
no significativos con diferencias de alta relevancia científica y práctica. La relación entre estos términos 
(Rosenthal y Rosnow, 1991) se resume en el argumento: Significación estadística = Magnitud del efecto x 
Tamaño muestral. Por tanto, a la hora de valorar los resultados de una investigación debe considerarse 
también si el tamaño de la diferencia es científica o prácticamente relevante. La interpretación conjunta 
de la significación estadística y la magnitud de la diferencia permite aproximar la significación práctica 
del resultado. Esta es la razón por la que resulta más conveniente un informe de los resultados a base 
de un intervalo de confianza (que incluye una estimación puntual de la diferencia y su error típico) más 
que un argumento de probabilidad, que concluir si la prueba resultó o no significativa. 

Las AMENAZAS CONTRA LA VALIDEZ DE LA CONCLUSIÓN ESTADÍSTICA (cuadro 6.5) recogen una serie 
de situaciones donde la inferencia estadística podría resultar problemática, produciendo errores tipo I 
y II, o donde la magnitud del efecto podría resultar sesgada. La lista de las principales amenazas contra 
la validez de la conclusión estadística se ha adaptado de Shadish et al. (2002, p. 45). 


CUADRO 6.5 
Amenazas contra la validez de la conclusión estadística 


Amenaza 


Breve explicación 


Baja potencia estadística 


Un estudio con baja potencia estadística puede concluir de forma 
incorrecta que una relación funcional no es significativa. 


Violación de los supuestos 
de las pruebas estadísticas 


La violación de los supuestos de las pruebas estadísticas puede 
conducir a infra- o supraestimación del tamaño y la significación 
del efecto de tratamiento. 


Violación de la tasa de 
error tipo I 


La tasa de error tipo 1 (p. ej., a =.05) es válida para una sola prueba 
estadística, pero aumenta en el caso de pruebas simultáneas; p. ej., 
para 2 pruebas «> =.10 y para 5 pruebas a; =.25. 


Escasa fiabilidad de la 
medida de las variables 


Si las medidas de tratamiento y/o respuesta no presentan alta fiabi- 
lidad, las conclusiones sobre covariación pueden ser inapropiadas. 


Restricción del rango de 
las variables 


Cuando las variables presentan restricciones en su variación tanto en 
el rango superior (efecto techo) como en el inferior (efecto suelo) de la 
escala, la potencia disminuye y la inferencia se debilita. 


Falta de fiabilidad de 
la administración de los 
tratamientos 


Las conclusiones sobre covariación serán afectadas si los tratamientos 
se administran de forma inconsistente de un nivel a otro, o dentro de 
un mismo nivel, de una persona a otra. 


Varianza extraña en el contexto 
de investigación 


También se afectan las conclusiones sobre covariación si algunas 
características del contexto inflan el error de forma artificial. 


Heterogeneidad de las 
unidades de muestreo 


Cuanto más heterogéneas son las unidades experimentales que 
reciben un nivel de tratamiento, mayor será la desviación típica 
de ese nivel y menos probable se hace la detección de covariación 
entre tratamiento y respuesta. 


Estimación imprecisa del 
tamaño del efecto 


Algunos estadísticos sistemáticamente infra— o sobreestiman la 
magnitud de un efecto. 
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6.3.2. Validez interna 


Utilizamos el término validez interna para hacer referencia a inferencias acerca de si la covariación 
observada en un efecto (Y) se ha producido debido a cambios en el nivel o intensidad de una variable 
explicativa (X) y no por otras fuerzas causales alternativas. La forma más común de inferir de causa a 
efecto consiste en eliminar esas otras causas posibles (Mackie, 1974). Las AMENAZAS CONTRA LA VALI- 
DEZ INTERNA del cuadro 6.6 son un listado de posibles causas alternativas (terceras variables, variables 
extrañas, confundidores o variables espurias) que podrían haber ocurrido en presencia o en ausencia de 
la variable explicativa y ser responsables el efecto observado. 

Es sin duda un error pensar que todas las terceras variables Z que se relacionan con X y con Y 
son necesariamente confundidores. La figura 6.5 asume una relación básica entre X e Y junto con la 
presencia de una tercera variable Z y delimita cinco posibles relaciones entre las variables implicadas. 


1. El diagrama a) es la situación ideal, donde la relación entre una variable independiente (X) y una 
variable dependiente (Y) no es afectada por la intervención de otras variables extrañas posibles, 
y es por ello una RELACIÓN CAUSAL DIRECTA que se analiza con modelos ANOVA en el contexto de 
un diseño experimental. Se asume que en este caso ideal no hay terceras variables que puedan 
explicar alternativamente la relación entre X e Y. En esta situación todas las variables extrañas, 
observables o no observables (latentes), reparten su efecto equilibradamente entre los grupos y 
por tanto no hay sesgo de selección. 


E 
y P do, 
RELACIÓN CAUSAL DIRECTA ) 
Xx X AY 
b) Y | RELACIÓN MODERADORA 
Z O CONDICIONAL 


RELACIÓN DE COVARIACIÓN 


XA Y 


RELACIÓN MEDIACIONAL 


RELACIÓN ESPURIA 


Figura 6.5. — Cinco tipos de relación entre variables. 


2. El diagrama b) es una situación donde, además del efecto (primario) de la variable independiente 
X sobre la dependiente Y, se contempla también el efecto (secundario) de la covariante Z, que se 
asume independiente de X. Es la RELACIÓN DE COVARIACIÓN, que se analiza con modelos ANCOVA. 
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3. El diagrama c) contiene una tercera variable Z que es causa tanto de X como de Y. La relación 
que mantienen X e Y es una RELACIÓN ESPURIA O DE CONFUNDIDO porque dependen de una cau- 
sa común, y por tanto es una relación no causal que aparece cuando no se tiene en cuenta Z y 
desaparece cuando Z se controla. La variable Z es una VARIABLE ESPURIA O VARIABLE DE CONFUN- 
DIDO, ya que proporciona una explicación alternativa de la asociación entre X e Y. 


4. El diagrama d) contiene también una tercera variable Z que modera o condiciona la relación en- 
tre X e Y. Se denomina en este contexto RELACIÓN MODERADORA O CONDICIONAL y se trató en el 
capítulo 2. Por ejemplo, la relación que existe entre exposición al sol (X) y quemaduras solares (Y) 
es clara, pero puede ser moderada por el grupo étnico (Z), ya que la relación es mucho más po- 
tente en individuos con piel blanca que en individuos con piel morena. La variable Z se considera 
en este contexto una VARIABLE MODERADORA. 


5. El diagrama e) muestra también la presencia de la tercera variable, que interviene entre la variable 
independiente y la variable dependiente. La relación resultante se denomina RELACIÓN MEDIA- 
CIONAL y se trató también en el capítulo 2. La variable Z se denomina en este contexto VARIABLE 
MEDIADORA. Por ejemplo, numerosos estudios parecen demostrar que el estado depresivo de las 
amas de casa (Y) se agrava durante los días de lluvia y frío intenso (X). Atribuir la depresión de las 
amas de casa al tiempo atmosférico supone ignorar que ambas variables pueden encontrarse en 
un estado de relación mediacional, ya que tales días las amas de casa suelen encerrarse en casa 
inhibiendo todo contacto social (Z). La relación que se establece entonces es que el frío intenso 
(X) provoca inhibición del contacto social (Z), lo que a su vez agrava la depresión (Y). 


La presencia de variables espurias o de confundido en una investigación reducirá la validez interna de 
la investigación, mientras que su ausencia se asocia con alta validez interna. La ASIGNACIÓN ALEATO- 
RIA de unidades experimentales a tratamientos es por ello el procedimiento metodológico más efectivo 
para lograr que un diseño tenga alta validez interna, porque elimina los sesgos de selección y genera 
una situación donde es improbable que existan efectos de confundido. Entre sus propiedades destacan 
(Anderson ef al., 1980, p. 32-35) las siguientes: 


— La asignación aleatoria implica en general una distribución similar de las características de los 
participantes en cada grupo, antes de administrar el tratamiento, y por tanto facilita la inferencia 
causal en mayor medida cuanto mayor sea el tamaño muestral. 


— La asignación aleatoria elimina el sesgo de selección. Si una muestra seleccionada de una pobla- 
ción se asigna a grupos mediante una regla de asignación aleatoria, es bastante improbable que 
los sesgos de selección puedan intervenir. Aunque es posible que ambos grupos no queden per- 
fectamente equilibrados en alguna característica antes de administrar el tratamiento, esta posibi- 
lidad es tanto menor cuanto mayor es el tamaño de los grupos. 


— La asignación aleatoria proporciona un fundamento para la inferencia estadística al equilibrar los 
grupos antes de la administración de los tratamientos. 


Validez de la conclusión estadística y validez interna se relacionan estrechamente. Ambas se ocupan 


de analizar las operaciones de causa y efecto respecto de los constructos que se supone que represen- 
tan. La validez de la conclusión estadística se interesa por los errores que aparecen cuando se analiza 
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la covariación estadística entre tratamiento y respuesta, mientras la validez interna se interesa por los 
errores que se presentan cuando se realizan inferencias causales. 

El cuadro 6.6 presenta una lista de las principales AMENAZAS CONTRA LA VALIDEZ INTERNA (adaptada 
de Shadish et al., 2002, p. 55), que son variables extrañas que pueden estar presentes en el contexto de 
investigación generando confusión. 


CUADRO 6.6 
Amenazas contra la validez interna 


Amenaza Breve explicación 


Precedencia temporal La falta de claridad sobre qué variable ocurrió primero puede producir ambi- 
ambigua de la causa glúiedad sobre la naturaleza de la relación entre causa y efecto. 


Selección Diferencias sistemáticas en las características de las unidades que son previas 
ala administración del tratamiento. Tales diferencias se denominan sesgos de 
selección y se eliminan utilizando, cuando es posible, la asignación aleatoria 
de las unidades a los tratamientos. 


Historia Acontecimientos sociales que ocurren entre el inicio de un tratamiento y la 
medida del efecto y pueden explicar el efecto observado. 


Maduración Cambios psico-biológicos que se presentan de forma natural con el tiempo 
que pueden confundirse con el efecto. 


Regresión estadística Cuando las unidades utilizadas se selecccionan por sus valores extremos 
presentan valores menos extremos en una segunda medición. 


Pérdida de sujetos La pérdida de sujetos (mortalidad) puede producir efectos artificiales si la 
pérdida es selectiva y afecta a unos tratamientos respecto de otros. 


Administración de pruebas | La administración de un test puede alterar los resultados que se obtienen en 
administraciones ulteriores del test. 


Instrumentación La naturaleza de una medida puede cambiar a lo largo del tiempo o ser dife- 
rente de un nivel de tratamiento a otro, confundiendo el efecto de tratamiento. 


Efectos aditivos/interactivos | Elimpacto de una amenaza puede sumarse al de otra o depender del nivel 
de las amenazas anteriores | de otra amenaza. 


6.3.3. Validez de constructo 


Las teorías psicológicas se definen en términos de conceptos teóricos y constructos hipotéticos que 
no pueden ser directamente observados o medidos. Con el fin de ser sometidos a prueba empírica, los 
constructos abstractos tienen que ser traducidos en indicadores tangibles susceptibles de observación y 
medida. Este proceso se denomina operacionalización. En general, los indicadores suelen ser represen- 
taciones parciales e imperfectas de los constructos de referencia. 

La validez de constructo se refiere precisamente a la capacidad de generalizar de indicadores tangi- 
bles a sus constructos de referencia. Muchos de los problemas se deben a una inadecuada explicación 
o comprensión de los constructos por parte de los investigadores; otros problemas son motivados por 
una deficiente observación y medida de los constructos. En investigación con sujetos humanos, ade- 
más, es muy común que se presenten problemas de reactividad derivados de la interacción social entre 
individuos, lo que complica extraordinariamente la investigación del comportamiento humano. 

El cuadro 6.7, adaptado de Shadish et al. (2002, p. 73) presenta un listado de las más comunes AME- 
NAZAS CONTRA LA VALIDEZ DE CONSTRUCTO. Son un conjunto de errores, que la experiencia ha demos- 
trado que tienden a ocurrir con frecuencia, relativos a la falta de adecuación entre los indicadores u 
operaciones utilizados en una investigación y los constructos a los que se supone hacen referencia. 
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Amenaza 


CUADRO 6.7 
Amenazas contra la Validez de Constructo 


Breve explicación 


Explicación inadecuada de los 


constructos 


El fracaso en explicar adecuadamente un constructo puede conducir a 
inferencias incorrectas sobre la relación entre indicador y constructo. 


Confundido de constructos 


Las operaciones usualmente utilizan más de un constructo, y el fracaso en 
describir todos los constructos puede dar lugar a inferencias incompletas. 


Sesgos debidos al uso de una 
sola operacion 


Una única operacionalización de un constructo subrepresenta el constructo 
de interés y mide constructos irrelevantes. 


Sesgos debidos al uso de un 
solo método 


Cuando todas las operacionalizaciones utilizan el mismo método, el método 
pasa a ser parte del contructo. 


Confusión de constructos y 
niveles de constructo 


Las inferencias sobre los constructos que mejor representan las operaciones 
pueden fracasar en describir los niveles limitados de los constructos. 


Estructura factorial sensible 


La estructura de la medida puede cambiar como resultado del tratamiento. 


Cambios reactivos en los 
autoinformes 


Los autoinformes pueden ser afectados por la motivación generada por estar 
en una condición de tratamiento. 


Reactividad a la situación 
de investigación 


Las respuestas de las unidades experimentales no sólo dependen de los trata- 
mientos recibidos sino también de su propia percepción de la situación. Las 
técnicas de control placebo, ciego simple y ciego doble son esenciales aquí. 


Expectativas del 
experimentador 


El experimentador puede influir en las respuestas revelando de forma no 
consciente sus expectativas ante respuestas deseables que pasan a formar 
parte integrante del constructo. 


Efectos de la novedad y de la 
interrupción de la norma 


Los sujetos suelen responder mejor a situaciones nuevas y/o innovadoras 
y peor a situaciones que suponen una interrupción de la norma. 


Efectos reactivos de ciertas 


Situaciones que pueden modificar la respuesta de las unidades tales como: 


situaciones 


(a) la igualación compensatoria, (b) la rivalidad compensatoria, (c) la desmo- 
ralización por resentimiento y (d) la difusion o imitación de los tratamientos. 


6.3.4. Validez externa 


La validez de constructo representa una forma de generalizabilidad de los resultados observados de 
un estudio empírico al marco conceptual en que se inserta. Otra forma de generalizabilidad tiene que 
ver con la replicabilidad empírica del fenómeno, es decir, con la posibilidad de que pueda ser reproduci- 
do en las mismas condiciones en que originalmente se produjo. Esta forma de generalizabilidad conecta 
directamente con la validez externa de la investigación. 

La validez externa se refiere a la cuestión de si un efecto observado en un contexto de investigación 
puede ser observado en otros contextos, con diferentes participantes, con otros tratamientos y respues- 
tas distintos y con diferentes procedimientos de investigación. Esta cuestión es conceptualmente simi- 
lar a la interacción estadística, porque básicamente consiste en determinar si la relación causa-efecto es 
la misma en dos (o más) contextos diferentes, o con dos (o más) tipos de participantes, etc. Por ejemplo, 
si investigamos la relación funcional existente entre un nuevo programa educativo y el rendimiento en 
una disciplina y existe una interacción entre el programa y la clase social de los niños, entonces el ta- 
maño del efecto no se podrá mantener constante para diferentes clases sociales y no se podrá afirmar 
que el mismo resultado se observa en todas las clases sociales. Por tanto, la relación funcional entre el 
programa y el rendimiento no es generalizable para diferentes participantes (de una clase social a otra). 

Las AMENAZAS CONTRA LA VALIDEZ EXTERNA se refiere a aquellas situaciones donde suelen produ- 
cirse interacciones estadísticas que generan inferencias incorrectas de generalización de los resultados 
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de un estudio a diferentes personas, contextos, tratamientos y respuestas. En tales situaciones, la inves- 
tigación sólo es representativa de las personas, contextos, tratamientos y respuestas empleados, lo que 
limita severamente su generalidad. El cuadro 6.8 presenta un listado de las amenazas contra la validez 
externa más comunes (adaptado de Shadish et al., 2002, p. 87). 


CUADRO 6.8 
Amenazas contra la validez externa 


Amenaza Breve explicación 
Interacción de la relación | Un efecto de tratamiento encontrado con ciertas unidades experi- 
causal con las unidades mentales podría no aparecer con otras unidades diferentes. 
Interacción de la relación | La magnitud y dirección de un efecto de tratamiento puede ser 
causal con el tratamiento | diferente en función del nivel de tratamiento en el que se estudia. 


Interacción de la relación | Un efecto de tratamiento encontrado con un tipo de respuesta 
causal con las respuestas puede ser diferente con otro tipo de respuesta distinto. 
Interacción de la relación Un efecto de tratamiento encontrado en un contexto determinado 
causal con el contexto puede ser diferente en otro contexto distinto. 
Mediación dependiente del | Una variable mediadora de una relación causal en un contexto 
contexto puede no mediar de la misma forma en otro contexto. 


6.4. EL DISEÑO DE EXPERIMENTOS Y NO EXPERIMENTOS 


6.4.1. Tradiciones de la investigación experimental en Psicología 


Una concepción histórica de la investigación experimental en Psicología revela la preocupación por 
el control desde sus inicios y explica en gran medida la forma de proceder de los investigadores de las 
Ciencias del Comportamiento. Pese a lo que comúnmente se piensa, no existe una concepción mo- 
nolítica de la investigación experimental. Dos diferentes tradiciones, surgidas en momentos históricos 
distintos y con propósitos netamente diferentes, conviven actualmente en la práctica psicológica: 


1. Por un lado, existe un tipo clásico de experimentación, más característico de las Ciencias Natura- 
les y basado en la variabilidad intraindividual, donde algún tipo de intervención discreta se aplica 
en el contexto de laboratorio sobre muestras idealmente puras de materiales, con la finalidad de 
establecer predicciones numéricas precisas. El marco del laboratorio permite a los investigadores 
un control óptimo de las condiciones físicas y el aislamiento de materiales y variables dentro de 
cámaras protectoras, tubos de ensayo esterilizados, etc., y generalmente involucran al menos una 
unidad experimental o un pequeño número de unidades. Este tipo de tradición experimental, que 
Cook y Campbell (1986, p. 141) denominaron TRADICIÓN DEL CONTROL EXPERIMENTAL, se impuso 
en Ciencias Naturales durante los siglos XVII y XVIII y se importó después a la Psicología. 


2. Por otro lado, existe otro tipo más reciente de experimentación, más característico de las Ciencias 
Sociales y basado en la variabilidad interindividual, que consiste en sustituir el control de labora- 
torio por el control estadístico obtenido mediante la asignación aleatoria de muchas unidades a 
las condiciones experimentales. Esta tradición fue, en gran medida, elaborada en el contexto de 
la investigación agrícola por Fisher y colaboradores a principios del siglo XX. Cook y Campbell 
(1986, p. 142) lo denominan TRADICIÓN DEL CONTROL ESTADÍSTICO. 
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Curiosamente, ambas tradiciones de la investigación experimental se practican actualmente en las 
Ciencias del Comportamiento (Ato, 1995a). La primera tradición fue adoptada por Fechner y Wundt, 
aplicada entre otros por Thorndike, Ebbinghaus y Pavlov durante el primer cuarto de siglo en psicolo- 
gía experimental y, tras complejas transformaciones, se practica hoy entre los seguidores de la corriente 
skinneriana del "Análisis experimental de la conducta". El objetivo de esta concepción es estudiar la 
conducta individual de uno o de unos pocos organismos, usualmente bajo un rígido control experi- 
mental basado en las técnicas de eliminación, constancia y equilibración de las variables extrañas, para 
encontrar relaciones funcionales estables entre la conducta y las variables que la determinan. La tradi- 
ción del control experimental tuvo su punto álgido a finales del siglo XIX y principios del XX. Reducido 
inicialmente a los confines del laboratorio y la investigación básica, pasó después a fundirse con la in- 
vestigación desarrollada en contextos aplicados durante la década de los 60 y ulteriormente refinado 
para desembocar en un peculiar tipo de metodología que aglutina los DISEÑOS DE CASO ÚNICO, que 
serán objeto de interés en el capítulo 12 del texto. 

La tradición del control estadístico, de antecedentes menos remotos y vinculada con la investigación 
en las Ciencias Sociales y el estudio de las diferencias individuales, se convirtió hacia mediados del siglo 
XX en la forma más común de investigación, al mismo tiempo que la tradición del control experimental 
era cada vez menos usada, y hoy por hoy constituye la forma más típica de metodología experimental 
practicada. En Psicología y disciplinas afines, el control experimental óptimo de las infinitas variables 
extrañas practicado por la tradición del control experimental resultaba en ocasiones imposible de ob- 
tener, y cuando se lograba, la conducta resultante parecía trivial (si se realizaba en marcos naturales), o 
artificial (si se realizaba en el marco de laboratorio). Como consecuencia del razonamiento estadístico 
moderno, de la mano de Fisher, Neyman, Pearson y Wald, entre otros, el enfoque del control estadístico 
desarrolló el denominado EXPERIMENTO ALEATORIO, basado en la comparación de al menos dos gru- 
pos compuestos de unidades experimentales asignadas al azar y tratados de forma diferente (GE y GC). 
Esta idea se convirtió con el tiempo en el enfoque normativo de la investigación experimental de las 
Ciencias Sociales. El desarrollo de esta idea son los DISEÑOS EXPERIMENTALES, que constituyen la parte 
fundamental del texto y se tratan en los capítulos 7 a 10. 

Partiendo del experimento aleatorio como el marco ideal para el establecimiento de relaciones causa- 
efecto, para dar respuesta a muchos problemas de investigación en los que no era factible o no era ético 
aplicar la asignación aleatoria, los investigadores de las Ciencias Sociales propusieron alternativas al 
experimento aleatorio conservando todas sus propiedades, excepto precisamente la que justifica la in- 
vestigación experimental, o sea, la asignación aleatoria de unidades experimentales a tratamientos. Los 
más importantes DISEÑOS CUASIEXPERIMENTALES (Campbell y Stanley, 1966; Cook y Campbell, 1979; 
Shadish et al., 2002), derivados de esta idea, se tratan en el capítulo 11 del texto. 

Los DISEÑOS COMPARATIVOS, donde el investigador no tiene control sobre la variable o variables 
independientes porque el tratamiento ya ha tenido lugar o porque no es posible su control, siguen tam- 
bién la estructura del experimento como modelo ideal de investigación, pero emplean numerosas técni- 
cas de control para minimizar la varianza de error y el sesgo sistemático y constituyen todo un repertorio 
de diseños que se tratan en el capítulo 13 del texto. 


6.4.2. Las tres estructuras básicas del diseño experimental 


Tal y como hoy lo conocemos, el DISEÑO EXPERIMENTAL €s la planificación de un experimento alea- 
torio con la intención de obtener la información máxima posible acerca del efecto de un tratamiento 
o combinación de tratamientos con los recursos de que se dispone. Al diseñar un experimento, el in- 
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vestigador debe plantearse algunas cuestiones iniciales a las que debe dar respuesta, en concreto las 
siguientes (Arnau, 1986; Kirk, 2013): 


— el conjunto de tratamientos que se incluirán en la investigación; 


— el conjunto de unidades experimentales que se emplearán junto con las formas de agrupamiento 
de tales unidades y el número de réplicas requerido; 


— los procedimientos por los que los tratamientos se asignarán a las unidades experimentales; 


— las técnicas que se utilizarán para controlar las potenciales variables extrañas, observables y no 
observables (latentes); 


— el conjunto de observaciones que se registrarán sobre las unidades experimentales antes, durante 
y/o después que los tratamientos se hayan administrado. 


Las respuestas a estas cuestiones no siempre son sencillas y requieren una elaborada conjunción de 
todos los aspectos implicados con la finalidad de no desperdiciar el considerable esfuerzo que requie- 
re realizar un buen experimento. Para ayudar al investigador a conseguir un resultado óptimo es con- 
veniente distinguir tres estructuras básicas del diseño de experimentos, cuyo dominio y uso inteligente 
puede facilitar en gran medida la consecución de un buen experimento. Siguiendo a Ader y Mellenbergh 
(1999), Bailey (2008), Mead (1988) y Milliken y Johnson (2009), tales estructuras básicas son: 


1. la ESTRUCTURA DE LOS TRATAMIENTOS, que se refiere a la forma de combinar las variables inde- 
pendientes o factores de la investigación; 


2. la ESTRUCTURA DEL CONTROL, referida a las formas de agrupar las unidades experimentales, con 
con el objeto de controlar variables extrañas, reduciendo la heterogeneidad y minimizando la 
varianza de error; 


3. la ESTRUCTURA DEL ERROR, que concierne al tamaño (o entidad) de las unidades experimentales 
utilizadas en la investigación. 


Analizamos a continuación cada una de estas estructuras básicas para la realización de un diseño ex- 
perimental (y por extensión para servir de apoyo en la realización de diseños cuasiexperimentales y 
comparativos) y la selección de un análisis estadístico apropiado, lo que nos permitirá al mismo tiempo 
definir los principales diseños que se emplean en la investigación psicológica aplicada. 


6.4.3. La estructura de los tratamientos 


La estructura de los tratamientos es el conjunto de factores (tratamientos o combinaciones de tra- 
tamiento) que el experimentador desea utilizar en su investigación. Algunas de las estructuras de trata- 
miento más comunes han sido tratadas en capítulos anteriores (en particular, en los capítulos 3-5). Son 
las siguientes: 


— La ESTRUCTURA DE TRATAMIENTO EN UN SENTIDO consiste en un conjunto de a tratamientos para 
un factor A donde no se asume relación alguna entre los tratamientos. Se analiza con modelos 
ANOVA de un factor (véase capítulo 3). Los efectos de tratamiento pueden definirse como fijos 
(modelo D o aleatorios (modelo ID. 
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— La ESTRUCTURA DE TRATAMIENTO EN DOS SENTIDOS consiste en una combinación factorial de a 
niveles de tratamiento de un factor A con b niveles de un factor B. Cuando las combinaciones de 
tratamiento de los dos factores se presentan en RELACIÓN DE CRUCE, entonces se observan todas 
las posibles combinaciones ax b de tratamiento. La relación de cruce es la estructura típica de tra- 
tamiento en dos sentidos. En cambio, cuando las combinaciones de tratamiento se presentan en 
RELACIÓN DE ANIDAMIENTO, solamente se observan algunas de las combinaciones de tratamiento 
y uno de los factores se anida dentro del otro. La relación de anidamiento se representa por A/B 
ó A(B), si el factor A está anidado dentro de B, y por B/A o B(A), si B está anidado dentro de A. 
Esta estructura puede presentarse bajo una de dos formas: 


+ con una réplica por combinación de tratamientos (DISEÑOS NO REPLICADOS); 


+ con más de una réplica (DISEÑOS REPLICADOS). 


No es posible estimar la varianza de error a menos que algunos o todos los tratamientos sean 
replicados. En consecuencia, en el caso de diseños no replicados no existirá varianza de error, 
aunque sí será posible obtener una estimación de la varianza residual. A su vez, ambos factores 
pueden ser fijos (si sus respectivos niveles de tratamiento se definen arbitrariamente), aleatorios 
(si los niveles de tratamiento de los dos factores se seleccionan aleatoriamente de la población), o 
bien mixtos (si uno de los factores es fijo y el otro aleatorio). 


— La ESTRUCTURA DE TRATAMIENTO EN MÁS DE DOS SENTIDOS consiste en una combinación facto- 
rial de tratamientos de más de dos factores. Además de la distinción replicado-no replicado, es 
también común distinguir entre dos tipos de estructura factorial: 


+ ESTRUCTURA FACTORIAL COMPLETA, cuando se observan todas las combinaciones de trata- 
miento en relación de cruce, y 


+ ESTRUCTURA FACTORIAL INCOMPLETA, cuando se observa sólo una parte o fracción de las 
posibles combinaciones de tratamiento. Una de las formas de estructura factorial incomple- 
ta se observa cuando las combinaciones de tratamiento se presentan en relación de anida- 
miento. Otras formas de estructura factorial incompleta pueden consultarse en Mead (1988) 
y Milliken y Johnson (2009). 


La estructura factorial completa contiene factores cuyos efectos pueden también definirse como 
fijos (modelo D), aleatorios (modelo ID) o mixtos (modelo IID. 


6.4.4. La estructura del control 


En la mayoría de las ocasiones, la sensibilidad de un diseño experimental para detectar, si existen, 
efectos de tratamiento depende dramáticamente del logro de hacer mínima la varianza residual y de 
controlar la presencia de variables extrañas. La ESTRUCTURA DEL CONTROL se refiere precisamente a la 
forma de agrupar las unidades experimentales con la finalidad de hacer mínima la varianza residual e 
implica utilizar procedimientos de control de las variables extrañas. Se llama también ESTRUCTURA DEL 
DISEÑO porque la selección de una estructura suele corresponderse con el nombre que se asigna al di- 
seño experimental resultante. La selección de la/s variable/s extraña/s más apropiadas para minimizar 
la varianza residual es una de las tareas que debe acometer el investigador durante la fase de diseño de 
la investigación. 
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Se han propuesto dos estructuras básicas de control para lograr el objetivo de optimizar la varianza 
residual, el control experimental y el control estadístico, pero hay muchas formas concretas de aplicar 
ambas estructuras de control, algunas de las cuales se muestran a continuación. 


— CONTROL EXPERIMENTAL MEDIANTE ALEATORIZACIÓN COMPLETA. Cuando las unidades experi- 
mentales son homogéneas, entonces no es preciso agruparlas en grupos homogéneos y el proceso 
de aleatorización se realiza directamente mediante el procedimiento denominado ALEATORIZA- 
CIÓN COMPLETA, donde cada unidad experimental recibe cualquier combinación de tratamiento 
por azar y el proceso de aleatorización no sufre ninguna restricción (o sea, se realiza directamente 
de unidad a tratamiento). Esta estructura de control es la más efectiva, se practica con el DISEÑO 
COMPLETAMENTE ALEATORIO (DC A), que es el diseño experimental estándar. Como consecuencia 
de emplear una regla de asignación aleatoria, las variables extrañas (observadas y no observadas) 
se reparten equilibradamente entre los tratamientos, evitando que se produzcan sesgos de selec- 
ción. La simplicidad de esta estructura de control deriva del hecho de que no es preciso controlar 
específicamente ninguna variable extraña. 


— CONTROL EXPERIMENTAL MEDIANTE ALEATORIZACIÓN RESTRINGIDA EN UN SENTIDO. Cuando se 
advierte la presencia de alguna variable extraña causante de heterogeneidad de las unidades ex- 
perimentales, es usual agruparlas primero en grupos homogéneos o bloques que difieren en la 
variable extraña (BLOQUEO SIMPLE) a cada uno de los cuales se aplica la estructura de los trata- 
mientos. La variable extraña que es objeto de clasificación o agrupamiento en bloques se deno- 
mina VARIABLE DE BLOQUEO, que pasa de ser una variable extraña no controlada a ser una variable 
controlada e incorporada al modelo. 


Puesto que la aleatorización no tiene lugar directamente de tratamiento a unidad experimental, 
sino que depende del bloque al que la unidad pertenece, la estructura de control resultante es 
una forma de ALEATORIZACIÓN RESTRINGIDA denominada BLOQUEO INTERSUJETOS. Cuando cada 
bloque representa un sujeto, la estructura de control se denomina BLOQUEO INTRASUJETO. 


— CONTROL EXPERIMENTAL MEDIANTE ALEATORIZACIÓN RESTRINGIDA EN DOS SENTIDOS. Menos co- 
mún, aunque bastante efectiva, es la estructura de aleatorización restringida en dos sentidos, que 
respecto de la anterior define un DOBLE BLOQUEO o doble agrupamiento de las unidades experi- 
mentales, una variable de bloqueo para las filas y una variable de bloqueo para las columnas, con 
el mismo número de niveles, sobre cuyas combinaciones se inserta una estructura de tratamiento 
en uno o más sentidos. El factor de tratamiento que se inserta en la estructura de doble bloqueo 
debe obviamente tener el mismo número de niveles que las variables de bloqueo. Esta definición 
supone una doble restricción de la aleatorización, que requiere aislar dos variables extrañas, la 
variable de bloqueo para las filas y la variable para las columnas, e introducirlas en el modelo 
para convertirlas en variables controladas. El resultado es un diseño experimental denominado 
DISEÑO DE CUADRADO LATINO. 


— CONTROL ESTADÍSTICO. Los procedimientos anteriores representan tres diferentes formas de apli- 
car el CONTROL EXPERIMENTAL, desde la más simple aleatorización completa a la más compleja 
aleatorización restringida en dos sentidos. Además, en cualquiera de los diseños que resultan de 
aplicar tales estructuras se pueden incluir también VARIABLES CONCOMITANTES O COVARIANTES, 
que son igualmente variables extrañas que se introducen en el modelo para controlar su efecto 
mediante el procedimiento de control que se denomina CONTROL ESTADÍSTICO porque se realiza 
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con procedimientos analíticos (en concreto, la reducción de la varianza explicada por la/s cova- 
riante/s), y no por procedimientos de diseño. 


La aplicación del control estadístico produce los DISEÑOS CON VARIABLES CONCOMITANTES (DVO), 
que se analizan mediante ANCOVA y representan una alternativa a los DBA caracterizada por 
utilizar una o más variables numéricas (las variables concomitantes o covariantes), al objeto de 
controlar su variación y optimizar la varianza residual o de error. 


6.4.5. La estructura del error 


La estructura del error se refiere a diferentes entidades de las unidades experimentales que pueden 
emplearse en una investigación. Esta es una cuestión técnica que requiere primero determinar si se ha 
utilizado más de un tamaño/entidad de unidad experimental y después identificar su naturaleza, lo que 
supone cierta destreza por parte del investigador. Una vez identificados los diferentes tamaños de las 
unidades experimentales, es posible construir un modelo matemático utilizando la estructura de los 
tratamientos y la estructura del control que corresponde a cada tamaño concreto. 

El tamaño de las unidades experimentales determina directamente la naturaleza del componente 
residual o de error. En los modelos ANOVA tratados en los capítulos 3 y 4, el componente residual o de 
error es único (o sea, se refiere a un único nivel), pero en algunos modelos ANOVA que trataremos en 
los siguientes capítulos el componente residual o de error puede ser múltiple (o sea, referido a múltiples 
niveles), y cada uno de ellos se define para un tamaño o entidad específico de las unidades experimen- 
tales. Como consecuencia, cada tamaño de unidad experimental tiene su propio componente residual 
O de error, su propia estructura de los tratamientos y su propia estructura de control. 

Los diseños que emplean diferentes tamaños o entidades de las unidades experimentales se llaman 
genéricamente DISEÑOS MULTINIVEL (D MN) porque requieren estructuras de error múltiples (Milliken, 
2003; Milliken y Johnson, 2009). Este tipo de diseños presenta ciertas dificultades analíticas que es ne- 
cesario tener en cuenta antes de proceder a la correcta interpretación de los resultados. Además de los 
modelos de regresión multinivel, en este texto tratamos los siguientes diseños multinivel: 


e El DISEÑO DE PARCELA DIVIDIDA (split-plot design, DP.D), utilizado sobre todo en Ciencias Expe- 
rimentales y Ciencias de la Salud, combina una estructura de tratamientos en dos o más sentidos 
con una estructura de control mediante bloqueo y al menos dos tamaños o entidades diferentes 
de unidad experimental con asignación aleatoria a los tratamientos. 


+ El DISEÑO DE MEDIDAS REPETIDAS (DMR), utilizado principalmente en Ciencias del Comporta- 
miento y Ciencias de la Salud, y particularmente en Psicología, es estructuralmente similar al 
DPD, pero difiere de aquél por la imposibilidad de practicar la asignación aleatoria de las uni- 
dades experimentales a los tratamientos dentro de cada bloque, que representan sujetos indivi- 
duales, aunque es posible emplear técnicas de control alternativas (p. ej., contraequilibración). 


. El DISEÑO JERÁRQUICO (D]JE) difiere de los anteriores por la utilización, cuando se combinan dos 
(o más) factores, de una relación de anidamiento, donde unidades experimentales de nivel inferior 
se anidan dentro de unidades de nivel superior. La relación de anidamiento puede producirse 
tanto en la estructura del control como en la estructura de los tratamientos. 


e El DISEÑO CONMUTATIVO (cross-over design, DCO) es una generalización del DMR que se utiliza 
frecuentemente en la investigación en Ciencias de la Salud. 
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Los restantes diseños que tratamos en este texto utilizan un tamaño único de unidad experimental 
y por tanto tienen una estructura de error única (o sea, requieren un único nivel de la jerarquía). 


6.4.6. La composición de un diseño de investigación 


Un diseño experimental es el resultado de combinar una estructura de tratamiento, una estructu- 
ra de control y una estructura de error, cada una de las cuales acarrea sus correspondientes grados de 
libertad. Para lograr identificar correctamente un diseño experimental y proponer un modelo matemá- 
tico y el análisis estadístico apropiado es imprescindible distinguir la forma como se han combinado 
estas tres estructuras esenciales. La figura 6.6 representa gráficamente el requisito esencial que requiere 
la combinación de una estructura de tratamiento y una estructura de control. Se parte de una estructura 
de los tratamientos y se utiliza alguna forma de aleatorización para asignar las combinaciones de trata- 
miento a las unidades experimentales que se han agrupado según una particular estructura de control. 
El requisito es que no debe existir interacción (y si existiera, se asume que no es significativa) entre la 
estructura de los tratamientos y la estructura del control. 


ESTRUCTURA 
DEL CONTROL 


ESTRUCTURA DE 


Aleatorización Unidades 


LOS TRATAMIENTOS /————————> Experimentales 


Combinaciones 
de tratamiento 


ESTRUCTURA 
DEL ERROR 


Figura 6.6. — Estructura de los tratamientos, del control y del error en un diseño experimental. 


Con la perspectiva de comprender cabalmente la fundamentación del diseño de investigación en 
todas sus vertientes (experimental, cuasiexperimental, de caso único y comparativo), puede tener in- 
terés reformular la ecuación 1.1, o ecuación general del modelado (DATOS = MODELO + ERROR) en los 
términos siguientes: 


DATOS |=|ESTR. DE LOS TRATAMIENTOS |+|ESTR. DEL CONTROL |+|ESTR. DEL ERROR (6.1) 


donde el componente MODELO es ahora una combinación de factores de tratamiento y factores de con- 
trol y el componente ERROR constituye también una estructura única o múltiple de elementos. 
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La reformulación de la ecuación 6.1 como una extensión de la ecuación 1.1 implica que para cons- 
truir un modelo matemático apropiado para analizar los datos de los diseños experimentales (y compa- 
rativos) se requiere identificar dos partes bien diferenciadas, a saber, una estructura de los tratamientos 
y una estructura del control que, en el caso más simple, se combina con una estructura de error única. 
Además, si se utilizan diferentes tamaños de unidad experimental, y por consiguiente diferentes estruc- 
turas de error, cada tamaño de unidad experimental o estructura de error requiere su propia combina- 
ción de estructuras de los tratamientos y del control. Los diseños experimentales se tratan con detalle 
en los capítulos 7 a 10. 

Los restantes diseños que forman parte de la estrategia manipulativa (cuasiexperimentales y de caso 
único), que no cumplen con la condición de asignación aleatoria, se componen también con las mismas 
estructuras definidas para el diseño experimental. Sin embargo, en estos diseños se intenta compensar 
la presencia de sesgo de selecciónintroduciendo técnicas de control apropiadas, tales como la diferencia- 
ción entre grupos con y sin tratamiento o el registro de medidas previas y posteriores a la introducción 
de los tratamientos. Los diseños cuasiexperimentales y los diseños de caso único se tratan respectiva- 
mente en los capítulos 11 y 12. 

Los diseños comparativos que forman parte de la estrategia asociativa, se componen también de las 
mismas estructuras definidas para los diseños experimentales. Pero en este tipo de diseños se impone 
además la restricción de no cumplir con ninguna de las dos condiciones básicas del experimento, y 
por ello la preocupación esencial es eludir las amenazas derivadas tanto del sesgo de selección como 
de la no utilización de variables manipuladas. El uso inteligente de técnicas de control apropiadas para 
tratar estos problemas permitirá valorar el éxito o fracaso de la aplicación de estos diseños, que se tratan 
brevemente en el capítulo 13. 


6.5. SUGERENCIAS DE ESTUDIO 


Este capítulo desarrolla algunos conceptos básicos sobre metodología de la investigación en Psico- 
logía. Hay excelentes textos que pueden consultarse para ampliar los contenidos de esta introducción. 
Especialmente asequibles por su sencillez y disponibilidad son Lee (2007) y Trochim y Donnelly (2007). 
En la misma linea, pero algo más exhaustivo es Kerlinger y Lee (2000) y muchas de las entradas de la en- 
ciclopedia sobre diseño editada por Salkind (2010). Con mayor nivel técnico se aborda la metodología 
de la investigación en Ader y Mellenberg (1999). Pero en nuestra opinión, la referencia más recomenda- 
ble por su presentación integrada sigue siendo, a pesar de haber transcurrido un cuarto de siglo desde 
su publicación, el texto de Pedhazur y Schmelkin (1991). En español todavía pueden consultarse Ato 
(1991) y la mayoría de los capítulos del texto de Anguera et al. (1995). También tiene interés consultar 
el conjunto de recomendaciones sobre el uso de la Estadística en el contexto de la Psicología Clínica y 
de la Salud propuestas por Palmer y Sesé (2013) y evitar los errores de consistencia en el informe de los 
resultados (Caperos y Pardo, 2013). 

Una referencia ideal sobre el tratamiento de la inferencia causal desde la perspectiva del enfoque de 
Rubin es Schneider et al. (2007). Para el enfoque de Campbell la referencia final es Shadish et al. (2002). 

En la formación básica de un investigador en Psicología no debe faltar el conocimiento de las téc- 
nicas de control más comunes. Una introducción a las técnicas de control básicas puede consultarse 
en Ato (1991, pp. 155-175). Otras técnicas relevantes más avanzadas, tales como las puntuaciones de 
propensión y el empleo de variables instrumentales, pueden consultarse en Shadish y Clark (2004) y en 
Greenland (2000). 
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Seguimos en lo fundamental el sistema de clasificación de los diseños de investigación en Psico- 
logía propuesto por Ato ef al. (2013b), cuya lectura también sugerimos. Un tratamiento metodológico 
pormenorizado para las diferentes áreas de la psicología puede consultarse en la colección "Blackwell 
Handbooks of Research Methods in Psychology”, editadas por Davis (2005), para la Psicología Experi- 
mental, Teti (2006), para la Psicologia del Desarrollo, Roberts e llardi (2005), para Psicología Clínica y 
Rogelberg (2004), para la Psicología Social, Industrial y Organizacional. 

Las ideas relativas a la estructura de una investigación experimental, y por extensión de todos los 
diseños cuasiexperimentales y comparativos, en base a una estructura de los tratamientos, una asequi- 
ble introducción a la estructura de control y una estructura determinada de error pueden consultarse 
en Milliken y Johnson (2009). Para un tratamiento más avanzado sugerimos también Milliken y Johnson 
(2009). 
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Abordamos en este capítulo los DISEÑOS INTERSUJETOS con estructura de control experimental por 
aleatorización completa, y concretamente el DISEÑO COMPLETAMENTE ALEATORIO, con factores en rela- 
ción de cruce, en sus variedades equilibrado y no equilibrado, y el DISEÑO JERÁRQUICO, con factores en 
relación de anidamiento. El capítulo siguiente tratará también los diseños intersujetos pero con otras 
estructuras de control, tanto el control experimental por aleatorización restringida (DISEÑOS DE BLO- 
QUES ALEATORIOS y DISEÑOS DE CUADRADO LATINO en sus variedades replicado y no replicado) como el 
control estadístico (DISEÑOS CON VARIABLES CONCOMITANTES). 


7.1. DISEÑOS COMPLETAMENTE ALEATORIOS 


Cuando la investigación que se planifica involucra el empleo de una estructura de tratamientos en 
un sentido, o bien una estructura factorial con factores en relación de cruce, y las unidades experimen- 
tales seleccionadas por el investigador tienen un tamaño único, muestran una alta homogeneidad en los 
valores observados de la variable de respuesta y pueden ser distribuidas al azar entre los tratamientos, el 
diseño más conveniente es el DISEÑO COMPLETAMENTE ALEATORIO (DC A). El diseño se llama SENCILLO 
cuando se utiliza con una estructura de tratamientos en un sentido, y FACTORIAL cuando se utiliza con 
una estructura de tratamientos en dos o más sentidos con relación de cruce. 

El DCA es un diseño experimental estándar en el que todos los tratamientos se asignan a las uni- 
dades experimentales siguiendo una regla de asignación aleatoria, es decir, mediante el procedimiento 
que hemos denominado aleatorización completa. Téngase en cuenta que este procedimiento de con- 
trol no elimina variables extrañas, pero tiende a promediar entre las condiciones de tratamiento cua- 
lesquier efectos de confundido (observable o no observable) que pudieran estar presentes, de tal modo 
que las comparaciones entre tratamientos pueden estimar efectos de tratamiento insesgados (aunque 
mezclados con un fondo de ruido aleatorio). La aleatorización tiende a distribuir por igual la influen- 
cia de variables extrañas que no se encuentran bajo el control del investigador y de ahí que una de sus 
principales propiedades sea excluir la presencia de SESGOS DE SELECCIÓN. 

El DCA destaca también por su alta flexibilidad. Puede acomodar cualquier número de tratamientos 
y cualquier número de unidades experimentales. Entre sus principales ventajas merecen destacarse las 
siguientes (Kirk, 2013; Maxwell y Delaney, 2004; Winer et al., 1991): 
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— El número de réplicas puede variar de tratamiento a tratamiento. Aunque las observaciones per- 
didas (missing data) no son especialmente problemáticas en DCA sencillos, sí lo son en DCA 
factoriales. Cuando el número de réplicas es homogéneo el diseño se llama EQUILIBRADO; en caso 
contrario, se llama NO EQUILIBRADO. 


— Cuando las unidades experimentales no presentan un alto grado de homogeneidad y se cono- 
cen las variables que causan heterogeneidad, es posible utilizar la técnica del control estadístico 
(ANCOVA) para reducir la varianza residual o de error. Los diseños resultantes tienen una base 
estructural similar a los DCA, pero incluyen variables concomitantes, y por tanto se tratan como 
DISEÑOS CON VARIABLES CONCOMITANTES. 


— El número de grados de libertad asociado con la MCp es mayor en diseños que utilizan aleatori- 
zación completa que en diseños que no utilizan aleatorización completa. 


— La aplicación del DCA requiere menos supuestos que otros diseños experimentales alternativos. 


La figura 7.1 es un diagrama de un DCA con estructura de tratamientos factorial 2 x 3. Nótese la dis- 
tinción que se hace en el diagrama sobre las tres estructuras del diseño experimental: la estructura de los 
tratamientos (parte inferior), la estructura del control (centro) y la estructura del error (parte superior). 
La principal característica de este diseño es que la estructura de control empleada es la ALEATORIZACIÓN 
COMPLETA de la estructura de los tratamientos entre las unidades experimentales, o sea, cada una de las 
unidades experimentales recibe por azar una de las combinaciones de la estructura de los tratamientos. 
A diferencia de otras estructuras de control alternativas que trataremos más adelante, esta estructura de 
control no requiere ningún parámetro para incluir en el modelo. La estructura del error es además única 
porque implica un tamaño único de unidad experimental. 


UNIDADES EXPERIMENTALES (N=18) 


$ADOAACGOOVOVOAVORO 


11 12 13 2 22 23 


ESTRUCTURA DE LOS TRATAMIENTOS 
(Factorial 2 x 3) 


Figura 7.1. — Representación del Diseño Completamente Aleatorio (DCA). 
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La principal desventaja del DCA es su ineficacia cuando las unidades experimentales son heterogé- 
neas. En tal caso son más convenientes los diseños que utilizan alguna forma de ALEATORIZACIÓN RES- 
TRINGIDA (control experimental) o incorporan variables concomitantes (control estadístico). 


7.1.1. Algunas cuestiones sobre notación 


La información sobre los resultados de un diseño experimental requiere una notación compacta, 
que afecta a las tres estructuras (tratamiento, control y error). Introducimos aquí algunas ideas que sus- 
tentan el uso de dicha notación. 

Un primer aspecto se refiere a la estructura de los tratamientos y al número de combinaciones de 
tratamiento de que consta el diseño. Un diseño experimental se identifica cuando se especifica, junto 
al tipo de diseño, el número de combinaciones de tratamiento que tienen cada uno de los factores. Así, 
el DCA:2x3x 4 es un diseño completamente aleatorio factorial con 3 factores (el número de dígitos) y 
2x3x4= 24 combinaciones de tratamiento, a = 2 niveles para el factor A, b= 3 para el factor B y c=4 
para el factor C. Los factores suelen recibir un nombre abreviado cuando se hace referencia a ellos, pero 
a efectos de computación es convencional denominarlos con letras latinas mayúsculas correlativas (A, 
B y C en el ejemplo). Los grados de libertad que corresponden a cada una de las fuentes de variación, 
como tratamos en capítulos anteriores, son el número de niveles del factor menos uno. Así, A tiene 
a—1= 1 grados de libertad, B tiene b-1=2 grados de libertad y C tiene c— 1 = 3 grados de libertad. 
Del mismo modo, los grados de libertad para los términos interactivos son el producto de los grados de 
libertad de los factores correspondientes. Así, BC tiene (b— 1)(c— 1) = 6 grados de libertad y ABC tiene 
(a— D(b- D)(c—1) = 6 grados de libertad. 

Un segundo aspecto se refiere al término de error. En los modelos ANOVA tratados en los capítulos 3 
y 4 utilizamos el término 'Residual' genéricamente como término de error, pero la notación que se em- 
plea en el diseño experimental requiere distinguir de forma precisa el tipo de residual de que se trata. En 
los DCA que se emplean en investigación psicológica el tipo más común de unidad experimental suele 
ser el sujeto participante, y de ahí que se emplee el símbolo especial S como un PSEUDO-FACTOR para 
representar la variación residual de las unidades experimentales, siendo n el número de niveles (o ré- 
plicas) de esta fuente de variación. Es importante advertir que las unidades experimentales que reciben 
un determinado tratamiento son diferentes de las que reciben otro tratamiento alternativo, y por tanto 
cabe afirmar que las unidades experimentales se anidan dentro delas combinaciones de tratamiento. La 
notación que se emplea para representar el término residual o de error en el DCA: ax bx c propuesto a 
título de ejemplo es S(ABC), que se lee «sujetos anidados dentro de las combinaciones de tratamiento 
ABC». Esta formulación del error es considerada como error puro y por tanto su esperanza matemática 
es E[S(ABC)] = 07. 

Existe también una relación directa entre la notación del término de error S(ABC) y el número de 
grados de libertad para la fuente de variación residual que puede servir como regla mnemotécnica para 
facilitar su cálculo. En general, los términos que se anidan dentro de otro u otros se encuentran fuera de 
los paréntesis (en este caso, S) y para el cálculo de los grados de libertad reciben el mismo trato que los 
factores principales, siendo por tanto sus grados de libertad igual al número de niveles menos uno, osea, 
n— 1. En cambio, los términos que reciben el anidamiento se encuentran dentro de los paréntesis (en 
este caso, las combinaciones de tratamiento ABC) y son tratados de forma distinta, siendo sus grados de 
libertad el producto del número de niveles de los términos implicados, o sea, abc. Aplicando esta regla 
mnemotécnica, por ejemplo, los grados de libertad para el término de error S(ABC) serían gls(ABc) = 
abc(n-—1). 
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7.1.2. Ejemplo 7.1: DCA factorial equilibrado 


El ejemplo 7.1 ilustra la utilización del diseño estándar de la investigación experimental en psicolo- 
gía (véase cuadro 7.1 y salida 7.1). Un investigador diseña un experimento de comprensión de textos me- 
diante la presentación de historias cortas donde la claridad de las historias (factor B) podía ser intacta 
sin ruido (nivel b1) o bien degradada con nivel de ruido moderado (nivel b2) y la rapidez de presentación 
(factor C) podía mostrarse con tasas de 100 (nivel cl) y 500 (nivel c2) palabras por minuto. Consideran- 
do que las historias cortas que se pretendían utilizar presentaban un amplio espectro de complejidad, 
que variaban desde historias simples tomadas de revistas del corazón a literatura filosófica compleja, 
el investigador decidió definir un continuo de historias cortas y seleccionar al azar cuatro historias de 
complejidad variable (factor A). Seleccionó un total de 48 estudiantes universitarios, a cada uno de los 
cuales se le asignó al azar una de las combinaciones de tratamiento. La variable de respuesta (VR) fue 
una medida ponderada de errores de comprensión alcanzada sobre el contenido de las historias. 

El cuadro 7.1 presenta los datos empíricos. Nótese que, a pesar de que se representa en horizon- 
tal para aprovechamiento máximo del espacio, debe tenerse en cuenta que desde un punto de vista 
computacional los datos deben tener una representación vertical en forma de vector, de forma que el 
final del primer cuadro (caso 12) se une con el siguiente (caso 13), y así sucesivamente. En este ejemplo, 
por tanto, el vector de respuesta tiene 48 filas, cada una de las cuales se corresponde con un caso. La 
salida 7.1 muestra los estadísticos descriptivos, a partir de la cual pueden aplicarse los procedimientos 
tratados en los capítulos 3 y 4 para el cálculo de las cantidades básicas y las sumas de cuadrados. 


CUADRO 7.1 
Datos empíricos del ejemplo 7.1 


1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 


.h 
N 


Para identificar el tipo de diseño empleado en el ejemplo 7.1 nótese, en primer lugar, que la estruc- 
tura de tratamientos es una estructura factorial 4 x 2x2, con 16 combinaciones de tratamiento, donde A 
representa el factor complejidad, B el factor claridad y C el factor rapidez de la presentación del material. 
En segundo lugar, esta estructura es un DCA porque cada una de las 16 combinaciones de tratamien- 
to se asignaron al azar a cada uno de los 48 sujetos utilizados. Puesto que hay un total de 48/16 = 3 
réplicas por tratamiento, se trata de un diseño equilibrado. Y en tercer lugar, la estructura del error es 
simple, porque sólo hay un tamaño de unidad experimental. Además, los factores B y C son factores 
fijos, porque sus niveles se han seleccionado arbitrariamente por el investigador, mientras que A puede 
considerarse aleatorio, ya que las historias se eligieron al azar de una supuesta población de historias. 
ES un DCA:4x2x2,n=3 y el modelo más apropiado es un modelo de efectos mixtos (o modelo IID. 
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SALIDA 7.1 
Análisis descriptivo de los datos del ejemplo 7.1 


Media Varianza 
13.0000 1.000 
15.0000 4.000 
14.0000 3.200 
32.0000 4.000 
34.0000 1.000 
33.0000 3.200 
22.5000 110.300 
24.5000 110.300 
23.5000 101.364 
15.0000 1.000 
20.0000 4.000 
17.5000 9.500 
32.0000 1.000 
38.0000 1.000 
35.0000 11.600 
23.5000 87.500 
29.0000 99.200 
26.2500 93.114 
20.0000 7.000 
22.0000 1.000 
21.0000 4.400 
36.0000 1.000 
38.0000 4.000 
37.0000 3.200 
28.0000 80.000 
30.0000 78.800 
29.0000 73.273 
21.0000 1.000 
25.0000 1.000 
23.0000 5.600 
38.0000 0.000 
40.0000 7.000 
39.0000 4.000 
29.5000 87.100 
32.5000 70.700 
31.0000 74.182 
17.2500 14.023 
20.5000 16.273 
18.8750 17.245 
34.5000 8.455 
37.5000 7.545 
36.0000 10.000 
25.8750 88.375 
29.0000 86.783 
27.4375 88.209 
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La ecuación básica del modelo completo incluye tres efectos principales (4,B y C), tres efectos in- 
teractivos de primer orden (AB, AC y BC) y un efecto interactivo de segundo orden (ABC): 


Yi ¡xi =Hjk1 + €ijkl 


(7.1) 
Y ij =4+ aj+ Br+Yy1+(a6) ¡x + (ay) ¡1 + (BY) 1 + (ABy) ¡xi + €i 511 


donde aj, (af) ¡ko (ay) ¡1 y (aby) ¡ki SON efectos aleatorios, u ¡ki es la estructura de los tratamientos, que 
se compone de los elementos u+ a+ PB +y1+(a6) ¡+ (ay) ¡+ (BN ri +(aBy) ¡ri y es ¡xi es la estructura de 
error. La aleatorización completa es la estructura de control experimental que se aplica en este ejemplo. 
La figura 7.2 presenta un gráfico que tiene gran interés para determinar la variación que presen- 
tan las medias de grupo. Debido a la dificultad para representar un gráfico con tres factores, es común 
descomponer la interacción de segundo orden segmentándola en función de uno de los factores. Se seg- 
menta por lo general el factor que menos niveles tiene. La relevancia del factor segmentado se evalúa 
en términos de la similitud existente entre las diferentes representaciones. En consecuencia, la figura 
7.2 representa la interacción A x C para los dos niveles de B. Nótese que hay un claro paralelismo entre 
las lineas para B = bl, y una cierta divergencia para B = b2, concretamente para el nivel A = a2, donde 
parece concentrarse la interacción, pero nótese la diferente escala que muestra el eje de ordenadas. 


VR.mean 
VR.mean 


Figura 7.2. — Gráfico de la interacción A x C, para B = b1 (izquierda) y para B = b2. (derecha). 


La estrategia más conveniente para determinar el mejor modelo para los datos del ejemplo 7.1 es el 
ajuste condicional de modelos. Con tres factores en relación de cruce, hay cuatro modelos posibles que 
representan niveles jerárquicamente diferentes desde una posición estricta del principio de marginali- 
dad, que en concreto son los siguientes: 
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— Modelo 2: Efectos principales o modelo aditivo (Y;jx1 = + Oj + Br+Y1+5jkD), 


— Modelo 3: interactivo de primer orden (Y; ¡x1 = + 0j+ Br+Y1+(aB) ¡+ (ay) ¡+ (BN xi + eijro, 


— Modelo 4: interactivo de segundo orden (Y; jx1 = 4+4j+Br+Y1+(a8B) ¡¿+lay) ¡+ (BN 1+(aBy) jr1+ 


€ijkt). 


Para aplicar el ajuste condicional de modelos con el paquete SPSS hay que ajustar uno a uno los 
modelos 2, 3 y 4. Puesto que hay un efecto aleatorio, se utiliza la versión clásica de ANOVA con efectos 
aleatorios mediante el enfoque no restrictivo para obtener las esperanzas de las medias cuadráticas, 
presentando información a pie de página sobre la construcción de la prueba F. Utilizando el principio 
de marginalidad en su forma estricta, el modelo interactivo de segundo orden (Modelo 4) no ajusta 
aceptablemente (véase salida 7.2), ya que la interacción de orden superior Ax B x C no fue significativa. 


SALIDA 7.2 


Ajuste del modelo interactivo de segundo orden (Modelo 4) 


Variable dependiente: VR 


Fuente 


SC tipo HI 


MC 


F 


Modelo 


ABC 
Residual 


4067.812 
384.562 
3519.187 
117.187 
18.563 
24.562 
0.188 
3.562 
78.000 


271.187 
128.187 
3519.187 
117.187 
6.188 
8.187 
0.188 
1.187 
2.438 


111.234 
9.7209 
568.758? 
14.3130 
5.2114 
6.895 
0.1584 
0.487* 


Total 


4(MCaB +MCac -MCagc) 


4145.813 


"MCAB»> “MCac» 


6 MCAasc» £MCr 


A continuación, el investigador debe someter a prueba el modelo siguiente en la jerarquía (Modelo 
3), que no incluye la interacción de segundo orden. Obsérvese que únicamente la interacción de primer 
orden A x C es significativa, y por tanto puede concluirse que el modelo ajusta aceptablemente. 


SALIDA 7.3 


Ajuste del modelo interactivo de primer orden (Modelo 3) 


Variable dependiente: VR 


Fuente 


SC tipo HI 


MC 


F 


Modelo 


Residual 


4064.25 
384.562 
3519.187 
117.187 
18.563 
24.562 
0.188 
81.563 


338.688 
128.187 
3519.187 
117.187 
6.188 
8.187 
0.187 
2.330 


145.359 
10.6434 
568.758? 
14.3120 
2.6551 
3.6551 
0.1584 


Total 
“%(MCaz + MCac — MC), PMCag, “MCac, ¿MCr 
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El último paso consiste en ajustar el modelo de efectos principales (Modelo 2), que se muestra en la 
salida 7.4. Una inspección ocular de los tres modelos probados permitiría concluir que el mejor modelo 
es el modelo interactivo de primer orden (Modelo 3). 


SALIDA 7.4 
Ajuste del modelo de efectos principales (Modelo 2) 


Variable dependiente: VR 
SC tipo HI MC F 
4020.938 804.188 270.497 
384.562 3 128.187 43.114% 
3519.187 3519.187 | 1183.631% 
117.187 117.187 39.414% 
Residual 124.875 2.973 
Total 4145.813 
4MCR 


Para determinar formalmente cuál de los modelos ajustados es mejor se emplea el ajuste condicio- 
nal de modelos de la salida 7.5. Procediendo como es usual con la lectura de los resultados del ajuste 
condicional de abajo a arriba, se descarta el Modelo 4, porque no difiere significativamente del Modelo 
3, y se selecciona el Modelo 3 porque difiere significativamente del Modelo 2. 

Es importante notar que se han utilizado las salidas del enfoque ANOVA clásico adaptado para in- 
cluir efectos aleatorios, con información a pie de página sobre la prueba de los efectos. Pero el ajuste 
condicional solo utiliza el componente residual y los grados de libertad residuales de cada modelo, y 
por tanto todo el proceso de ajuste podría realizarse también como si todos los efectos fueran fijos. 


SALIDA 7.5 
Ajuste condicional de los modelos 1 a 4 


Modelo 1: VR=1 
Modelo 2: VR= A+B+C 
Modelo 3: VR= A+B+C+AxB+AxC+BxC 
Modelo 4: VR= A+B+C+ Ax B+ AxC+BxC+AxBxC 
SCr ASCR 
4145.813 
124.875 4020.938 329.923 


81.563 43.313 2.655 
78.000 3.563 0.487 


La aplicación estricta del principio de marginalidad de Nelder permite seleccionar el modelo inte- 
ractivo de primer orden como modelo óptimo. La interpretación de los resultados debe concentrarse 
por tanto en la salida 7.3, despreciando todas las demás. Sin embargo, a la vista de los resultados de la 
salida 7.3, es obvio que no todas las interacciones de primer orden son estadísticamente significativas. 
Los principios del modelado estadístico propugnan que la búsqueda del mejor modelo no debe termi- 
nar hasta que no se hayan prescindido de todos los componentes superfluos (no significativos) de un 
modelo. En consecuencia, aunque este modo de proceder violaría el principio de la marginalidad, para 
conjugar los principios del modelado con el principio de marginalidad, muchos investigadores conside- 
ran una aplicación laxa del principio de marginalidad consistente en ajustar un nuevo modelo, derivado 
del Modelo 3, que prescinda de las interacciones no significativas Ax B y B x C. Llamamos al modelo 
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resultante MODELO INTERACTIVO DE PRIMER ORDEN SIMPLIFICADO (o Modelo 3s) porque pertenece a la 
jerarquía de modelos interactivos de primer orden, pero solo incluye las interacciones de primer orden 
que son estadísticamente significativas. Este modelo se ha ajustado también con ANOVA clásico adap- 
tado para efectos aleatorios con el programa SPSS en la salida 7.6 y asume también que se ha empleado 
un enfoque no restrictivo para obtener las medias cuadráticas esperadas y las razones F. 


SALIDA 7.6 
Ajuste del modelo interactivo de primer orden simplificado 


Variable dependiente: VR 
Fuente | SC tipo IM MC F 
Modelo 4045.5 449.5 174.767 
384.562 128.187 15.656 
3519.187 3519.187 | 1368.207? 


117.187 117.187 14.3139 

24.562 8.187 3.183? 
Residual 100.313 2.572 
Total 4145.813 
2MC ac, PMCr 


Finalmente, es conveniente aplicar el ajuste condicional de modelos comparando el Modelo 3 (como 
modelo ampliado) y del Modelo 3s (como modelo restringido). El ajuste se muestra en la salida 7.7 y 
apunta que el Modelo 3s es sin duda el modelo óptimo. 


SALIDA 7.7 
Ajuste condicional de los modelos 3s y 3 
Modelo 2: VR= A+B+C+AxC 
Modelo 3: VR= A+ B+C+Ax B+AxC+BxC 
Modelo SCr 


3s 100.313 
3 81.563 


El modelo interactivo de primer orden simplificado (3s) es por tanto el modelo con mejor ajuste. 
Para su interpretación destacamos los aspectos básicos del modelo ajustado, a saber, la existencia de un 
efecto interactivo Ax C junto con un efecto principal de B, que son los dos únicos efectos interpretables. 
Ambos efectos son mutuamente independientes, y por consiguiente su interpretación puede realizar- 
se por separado. Observando los promedios de grupo y la figura 7.2, puede afirmarse que los errores 
aumentan cuando la claridad se degrada: Fy(1,39) = 1368.207;P < .001, pero también aumentan co- 
mo consecuencia del efecto interactivo de la complejidad de las historias y la rapidez de presentación: 
Fac(3,39) = 3.183; P = .034. 

Una vez decidido el modelo óptimo mediante ajuste condicional, es conveniente utilizar el enfoque 
mixto para estimar los parámetros de los efectos fijos y los efectos aleatorios. La salida 7.8 resume la 
salida del enfoque mixto con el modelo interactivo de primer orden simplificado. En condiciones de 
regularidad, produce una información similar a la de la salida 7.6, pero cuando no se cumplen las con- 
diciones de regularidad, la información proporcionada por el enfoque mixto es más rigurosa y puede 
ser incluso diferente a la proporcionada por el enfoque clásico. 


OEdiciones Pirámide 


268 Diseños de investigación en Psicología 


SALIDA 7.8 
Ajuste del modelo interactivo de primer orden simplificado con enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de la varianza 97.129 194.258 (6) 200.258 205.678 
Efectos aleatorios 
Parámetros Estimador E. típico Zde Wald | P>|lz| 
Varianza a 10.000 8.739 1.144 .253 
Varianza 0%. 0.936 1.118 0.837 403 
Varianza o? 2.572 0.582 4.416 .000 
Efectos fijos 
Fuentes de variación 8lnum £8lden F P>F 
B (claridad) 1 39 1368,207 .000 
C (rapidez) 1 3 14.313 .032 


Los componentes de la varianza para los efectos aleatorios A y AC se obtienen aplicando los procedi- 
mientos ya conocidos a las fuentes de variación de la salida 7.6, para cuya finalidad es preciso examinar 
las medias cuadráticas utilizadas para obtener las razones F, o bien directamente de la salida 7.8. Así, 
los efectos aleatorios A y AC son los siguientes: 


MCA- MC 4) (128.188 — 8.187 
02 = MMCA-MCac) _ (AX Mo 
N 48 
MCa1c- MC 4)(2)(8.187 - 2.572 
a - “ol sc 2 _ WR E es 


Del mismo modo pueden también obtenerse los componentes de varianza para los efectos fijos: 


Ses (b- V(MC5¿- MC) — ()(3519.188 — 2.572) 


$ = 73.263 
N 48 
2 = 1)(MCc— MC 1)(017.187-8.187 
62 = UZDIMCG-MCAo) _ esas 
N 48 > 


Mientras los efectos fijos del modelo de la salida 7.8 (fuentes B y C) son estadísticamente significa- 
tivos, y su interpretación no resulta problemática, la interpretación de los componentes de la varianza 
es bastante más complicada. Por esta razón, resulta siempre recomendable reportar medidas de mag- 
nitud del efecto a partir de las estimaciones de las cuasivarianzas de los efectos fijos y de los compo- 
nentes de la varianza de los efectos aleatorios. Para los dos primeros se utiliza la omega cuadrada de 
Hays y para los dos siguientes el coeficiente de correlación intraclase. Puesto que la estimación de la 
varianza total es e = 10 + 0.936 + 73.263 + 2.271 + 2.572 = 89.042, las medidas de magnitud del efecto 
se obtienen dividiendo cada componente por la varianza total estimada: 0% = 73.263/89.042 = 0.823, 
0% =2.271/89.042 = 0.026, Pf =10/89.042 =0.112 y Pf” = 0.936/89.042 = 0.011. 

La potencia observada de la prueba del efecto de B es alto, Pg = 1, pero la del efecto de AC es bajo, 
Pac = 0.354 (véase Tabla G), porque no alcanza el valor recomendado de 0.80. Sin embargo, la propor- 
ción de varianza de la variable de respuesta que explican los componentes básicos del modelo, B y AC, 
es alta (0.823 + 0.011 = 0.834). Solo queda por explicar una pequeña proporción de error residual, de un 
16.5%. Para evaluar la solidez de esta investigación (y de otras investigaciones similares) es importante 
justificar si ha sido efectiva la aplicación del principio MAX-MIN-CON (la MINimización de la varian- 
za de error, uno de los objetivos de una investigación sólida, la MAximización de la varianza debida a 
tratamientos y el CONtrol de la varianza debida a las variables extrañas, observables o latentes). 
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7.1.3. Ejemplo 7.2: DCA factorial no equilibrado 


Un rasgo crucial del DCA del ejemplo 7.1 es que el número de réplicas para cada tratamiento (DCA 
sencillos) o para cada combinación de tratamientos (DCA factoriales) es homogéneo. Los diseños que 
tienen el mismo número de réplicas para cada combinación de tratamientos se denominan en general 
DISEÑOS EQUILIBRADOS. Pero con relativa frecuencia sucede que, pese a haber sido inicialmente plani- 
ficado como equilibrado, por razones diversas se pierden datos en el transcurso del estudio. En tal caso, 
el resultado final es un DISEÑO NO EQUILIBRADO. El inconveniente fundamental es que la pérdida de 
datos puede afectar dramáticamente a los resultados de una investigación. Hay que tener en cuenta 
que el problema de los datos perdidos es más sensible en la investigación no experimental que en la 
investigación experimental y más grave en investigación longitudinal que en investigación transversal. 


La conceptualización y el tratamiento de los valores perdidos (missing data) debe considerar el me- 
canismo por el que se perdieron los datos. Una útil taxonomía propuesta por Rubin (1976) distingue tres 
pautas diferentes de pérdida de datos. La menos problemática se presenta cuando los datos perdidos se 
producen por causas totalmente aleatorias (MCAR, missing completely at random), sin relación alguna 
con las variables reales o potenciales del estudio. En el caso de una pauta MCAR, cualquier observa- 
ción cuyo registro se ha planificado podría ser una observación perdida. Una pauta más problemática 
ocurre cuando los datos perdidos obedecen a un patrón aleatorio pero no dependen de las variables 
reales o potenciales de la investigación (MAR, missing at random). La pauta más problemática ocurre 
cuando los datos perdidos no son aleatorios y dependen de las variables reales o potenciales implica- 
das (MNAR, missing not at random). En este último caso, se dice que el mecanismo que controla los 
datos perdidos es no ignorable, en el sentido de que requiere un modelo explicativo de la pauta de datos 
perdidos para poder estimar parámetros insesgados. En los dos primeros casos (MCAR y MAR) se dice 
que el mecanismo es ¡gnorable, en el sentido de que no requiere un modelo explicativo de la pauta de 
datos perdidos, pero la cuestión central es la estimación insesgada de los parámetros. 

El problema esencial es que los métodos estadísticos se construyeron sobre el supuesto de que se 
registran todos los casos para todas las variables. Hasta hace poco tiempo, la forma de tratar los datos 
perdidos en todos los programas de estadística profesionales era simplemente ignorarlos y contabili- 
zar solo los casos registrados para todas las variables, eliminando los demás (listwise deletion). Esta 
solución es válida si se asume la pauta MCAR, pero puede reducir la potencia estadística de las prue- 
bas. Otra solución bastante extendida era imputar los datos perdidos con la media de todos los valores, 
pero esta solución plantea problemas analíticos por la presencia de una constante. Es mejor solución 
pronosticar valores perdidos mediante análisis de regresión, aunque también presenta problemas ana- 
líticos (Allison, 2010). Recientemente se han desarrollado métodos para estimar datos perdidos que pro- 
porcionarán estimadores todavía sesgados, pero con la garantía de que el tamaño del sesgo será en la 
práctica irrelevante. Los dos procedimientos más interesantes para estimar datos perdidos, que ya se 
incluyen en todos los paquetes estadísticos profesionales son la IMPUTACIÓN MÚLTIPLE y la ESTIMACIÓN 
POR MÁXIMA VEROSIMILITUD (Acock, 2005; Allison, 2001,2012; Baraldi y Enders, 2010; Graham, 2009). 

La aplicación del ANOVA con diseños completamente aleatorios sencillos y factoriales equilibrados 
produce sumas de cuadrados que son invariantes, independientemente del sistema de codificación uti- 
lizado o del tipo de sumas de cuadrados empleado. El reparto proporcional (equilibrado) de todas las 
réplicas permite reducir a cero la multicolinealidad de las fuentes de variación, y por tanto las SC TIPO 
1 O SECUENCIALES (es decir, las sumas de cuadrados que se obtienen cuando se introducen las fuentes 
de variación siguiendo un orden preestablecido: primero efectos principales, después efectos interac- 
tivos de primer orden, luego efectos interactivos de segundo orden, etc.) son iguales a las SC TIPO II 
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O PARCIALES (es decir, las sumas de cuadrados que reflejan la contribución de cada efecto del modelo, 
teniendo en cuenta el resto de los efectos incluidos en el análisis). Las SC TIPO II O JERÁRQUICAS son 
similares a las SC tipo III, pero se obtienen de forma jerárquica, es decir, primero ajustando los efectos 
interactivos y después los efectos principales. Los diseños no equilibrados producen SC tipo 1, tipo II 
y tipo III que no suelen ser coincidentes y además difieren en función del tipo de codificación usado. 
El problema que se plantea en estos casos es un problema de interpretación, particularmente cuando 
algún efecto es significativo utilizando un tipo de SC y no significativo con cualquier otro tipo. 

Para interpretar los resultados del análisis de varianza para diseños no equilibrados se recomienda 
emplear codificación tipo ANOVA (codificación de efectos) y SC tipo III y una considerable dosis de pre- 
caución y cautela, puesto que pueden encontrarse ciertas contradicciones en la salida de los programas 
estadísticos profesionales. Además, las fórmulas simplificadas que se trataron en el capítulo 3 no son 
apropiadas con diseños no equilibrados. En la mayoría de las ocasiones, el ajuste condicional de mode- 
los puede ser de gran ayuda en diseños no equilibrados, porque permite establecer el rango de modelos 
que podría ser objeto de análisis de un modo más exhaustivo. 

Ilustramos los diseños no equilibrados con el ejemplo 7.2, adaptado de Maxwell y Delaney (2004, 
p. 339). Los datos (ficticios) se muestran en el cuadro 7.2. Una psicóloga clínica investiga la efectividad 
relativa de tres distintos tipos de terapia (factor A), con niveles al (entrenamiento asertivo), a2 (terapia 
conductual) y a3 (terapia rogeriana) y la frecuencia de sesiones (factor B), con niveles b1 (baja), b2 (mo- 
derada) y b3 (alta), para mejorar los síntomas de la depresión endógena, evaluada en la escala MMPI. 
Se planificó con un total de 63 pacientes femeninos de un hospital que fueron distribuidos al azar entre 
las diferentes combinaciones factoriales, pero sólo concluyeron las sesiones 45 de los participantes. 


CUADRO 7.2 
Datos empíricos del ejemplo 7.2 


Caso | mmpi | terap | frecu Caso | mmpi | terap | frecu Caso  mmpi | terap  frecu 
1 41 condu | baja 22 56 roger | baja 43 43 asert baja 
2 43 condu | baja 23 47 roger | baja 44 56 asert baja 
3 50 condu | baja 24 45 roger | baja 45 48 asert baja 
4 condu | baja 25 46 roger | baja 46 46 asert baja 
5 condu | baja 26 49 roger | baja 47 47 asert baja 
6 condu | baja 27 ; roger | baja 48 ; asert baja 
7 ; condu | baja 28 3 roger | baja 49 : asert baja 
8 51 condu | mode 29 : roger | baja 50 59 asert | mode 
9 43 condu | mode 30 58 roger | mode 51 46 asert | mode 
10 53 condu | mode 31 54 roger | mode 52 58 asert | mode 
11 54 condu | mode 32 49 roger | mode 53 54 asert | mode 
12 46 condu | mode 33 61 roger | mode 54 : asert | mode 
13 : condu | mode 34 52 roger | mode 55 : asert | mode 
14 ; condu | mode 35 62 roger | mode 56 . asert | mode 
15 45 condu alta 36 . roger | mode 57 55 asert alta 
16 55 condu alta 37 59 roger alta 58 69 asert alta 
17 56 condu alta 38 55 roger alta 50 63 asert alta 
18 60 condu alta 39 68 roger alta 60 56 asert alta 
19 58 condu alta 40 63 roger alta 61 62 asert alta 
20 62 condu alta 41 ] roger alta 62 67 asert alta 
21 62 condu alta 42 ; roger alta 63 ; asert alta 
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El análisis descriptivo se muestra en la salida 7.9. Nótese el diferente número de réplicas para cada 
combinación de tratamiento en la última columna (n) de la salida 7.9. El gráfico de la interacción se ex- 
hibe en la figura 7.3, y aunque aparece una divergencia entre las terapias rogeriana y asertiva, el notable 
paralelismo entre las líneas sugiere la poco probable existencia de interacción. 


SALIDA 7.9 

Análisis descriptivo de los datos del ejemplo 7.2 
Variable dependiente: mmpi 
Media 
44.6667 
49.4000 
56.8571 
51.9333 
48.6000 
56.0000 
61.2500 
54.9333 
48.0000 
54.2500 
62.0000 
55.2667 
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Figura 7.3. — Gráfico de la interacción entre terap (A) y frecu (B). 
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La estructura de tratamientos en este diseño es factorial 3 x 3, y la estructura de control es aleatori- 
zación completa, ya que cada una de las 9 combinaciones de tratamiento se asignó al azar a cada uno 
de los 63 pacientes, por lo que la estructura del error es única. En su origen había un total de 7 réplicas 
por combinación de tratamientos, pero se perdieron algunas réplicas debido a la mortalidad experi- 
mental (attrition). Obsérvese que las réplicas que faltan aparecen señaladas con puntos en el cuadro 
7.2 y representan los VALORES PERDIDOS. Se trata por tanto de un DCA:3x3,N= 45 con los dos factores 
fijos (modelo D, donde N es el número total de casos, que se utiliza en lugar de las réplicas en todos los 
diseños no equilibrados. 

La salida 7.10 presenta los resultados del ajuste del modelo interactivo con eliminación de todos 
los casos que presentan valores perdidos (en total, 18 de los 63 casos inicialmente planificados). Por 
su parte, la salida 7.11 presenta los resultados imputando todos los casos perdidos con la media global 
(54.044), un procedimiento muy utilizado en el pasado, pero actualmente no recomendable. Lo utiliza- 
mos aquí con propósitos eminentemente didácticos. 


SALIDA 7.10 
Ajuste del modelo interactivo (con 'listwise deletion') 


Variable dependiente: mmpi 


Fuente 


SC tipo III 


MC 


Modelo 


terap 


frecu 


terap x frecu 


Residual 


1368.487 
204.762 
1181.105 
14.187 
1005.424 


171.061 
102.381 
590.553 
3.547 
27.928 


Total 


Ajuste del modelo interactivo (imputación con la media global) 


2373.911 


SALIDA 7.11 


Variable dependiente: mmpi 


Fuente 


SC tipo HI 


MC 


Modelo 


terap 


frecu 


terap x frecu 
Residual 


945.784 
72.2222 
795.269 
78.293 
1428.127 


118.223 
36.111 
397.635 
19.573 
26.447 


Total 


2373.911 


Obsérvese que la salida 7.10 presenta una moderada multicolinealidad mientras que la salida 7.11 
no y que la SC Total es la misma en los dos casos. Con la imputación única de los casos perdidos con la 
media global se han recuperado los 18 casos ausentes, pero la utilización de una constante para imputar 
todos los casos perdidos es un procedimiento poco riguroso. 

Es obvio por otra parte que el modelo interactivo no es aceptable, puesto que la interacción terap x 
frecu no es estadísticamente significativa en ninguno de los dos casos. Descartando la interacción entre 
ambos factores, las salidas 7.12 y 7.13 presentan los resultados del ajuste del correspondiente modelo 
aditivo para las dos situaciones que estamos analizando (eliminación de casos perdidos e imputación 
única con media grupal). 
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SALIDA 7.12 
Ajuste del modelo aditivo (con listwise deletion') 


Variable dependiente: mmpi 


Fuente 


SC tipo III 


MC 


Modelo 
terap 


frecu 
Residual 


1354.300 

238.483 
1253.189 
1019.611 


338.575 
119.241 

626.595 
25.490 


Total 


2373.911 


SALIDA 7.13 
Ajuste del modelo aditivo (con imputación única con media grupal) 


Variable dependiente: mmpi 


Fuente 


SC tipo HI 


MC 


Modelo 
terap 


frecu 
Residual 


867.491 
72.222 
795.269 
1506.420 


216.873 
36.111 
397.635 
25.973 


Total 


2373.911 


Una comparación entre las salidas 7.12 y 7.13 permite constatar que la primera sigue mostrando 
multicolinealidad mientras que la segunda no. Pero lo más importante es que mientras la interpretación 
de la salida 7.12 apuntaría significación para los efectos principales de terapia y frecuencia, en la de la 
salida 7.13 solo resulta significativo el efecto principal de frecuencia, pero no el de terapia. 

Tomando la salida 7.12 como la menos problemática de la dos si se asume la pauta MCAR, puede 
afirmarse que existe independencia entre terapia y frecuencia de sesiones, con predominancia clara de 
la terapia rogeriana sobre las restantes terapias y de la alta frecuencia sobre las demás. 

Para completar la interpretación de los datos del ejemplo 7.2, hemos utilizado el procedimiento de 
imputación múltiple del SPSS mediante 5 estimaciones de la tabla ANOVA con el objeto de sustituir los 
18 casos perdidos por valores imputados (véase Van Ginkel y Kroonenberg, 2014). Los resultados obteni- 
dos, promediando las 5 estimaciones realizadas, se muestran en la salida 7.14 y permiten demostrar que 
los efectos principales de terapia y frecuencia son sin duda estadísticamente significativos. Las compa- 
raciones entre medias de grupo no mostraron diferencias significativas entre las terapias rogeriana y 
asertiva, pero todas las restantes comparaciones fueron estadísticamente significativas. 


SALIDA 7.14 
Ajuste del modelo aditivo (con imputación múltiple) 


Variable dependiente: mmpi 
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Fuente 


SC tipo III 


MC 


Modelo 


terap 


frecu 


Residual 


2562.2751 
475.453 
2086.822 
1601.478 


640.569 
237.727 
1043.411 
27.612 


Total 


4163.754 
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7.2. DISEÑOS JERÁRQUICOS 


7.2.1. Introducción 


Una característica crucial de los diseños completamente aleatorios factoriales es que los factores 
presentan una estructura factorial completa, y por tanto se encuentran en una relación de cruce. Pero 
en algunas situaciones de la investigación psicológica y educativa los factores presentan una estructura 
factorial incompleta donde los factores no se encuentran en relación de cruce, puesto que faltan algunas 
combinaciones de tratamiento. Una de las más comunes de estas situaciones sucede cuando los factores 
se encuentran en relación de anidamiento. El resultado es el DISEÑO JERÁRQUICO (D]JE). 

Se dice que un factor (B) se anida o está anidado dentro de otro factor (4) si cada nivel del primero 
ocurre en conjunción con sólo un nivel del segundo. El diagrama siguiente representa dos tablas don- 
de se ilustra gráficamente la diferencia. En ambos casos se trata de un diseño factorial 3 x 2, pero la 
tabla de la izquierda corresponde a la situación de cruce, donde las 6 combinaciones de tratamiento 
están representadas mediante un aspa (X), mientras la tabla de la derecha corresponde a la situación de 
anidamiento, donde solamente se representan algunas de las combinaciones de tratamiento. Nótese en 
el segundo caso que los dos niveles de B se repiten para todos los niveles de A y por tanto se precisan 
también 2 x 3 grupos diferentes de unidades experimentales para representar la relación de anidamien- 
to. La diferencia crucial es que los dos niveles de B se asumen iguales a nivel de diseño, pero en realidad 
no son estrictamente iguales. En este contexto, la variable que repite el número de niveles es la VARIA- 
BLE ANIDADA. En el diagrama de la figura 7.4, la variable B es la variable anidada dentro de los niveles de 
la variable A. Es muy importante comprender que las dos situaciones representan de forma diferente 
la información procedente de una combinación factorial de las variables A (con 3 niveles) y B (con 2 
niveles). 


bl  b2 bl b2 b3 b4 b5 b6 
al| XxX | X al|XxX|X 
a |x|X al X|X 
aa | x|xXx as X|X 


Figura 7.4. — Diagrama comparativo para una relación de cruce (izquierda) y de anidamiento (derecha) 


El diagrama de la figura 7.4 (derecha) representa una relación de anidamiento para una variable 
anidada (B) dentro de otra (4) y se representa por B/A o bien B(4). Una generalización de este con- 
cepto ocurre cuando el anidamiento permite distinguir niveles de agregación jerárquicos. Un ejemplo 
bastante común se presenta cuando se estudia alguna característica educativa con alumnos tomados 
al azar de aulas tomadas al azar de colegios aleatoriamente seleccionados de comunidades autónomas 
elegidas también al azar. Una jerarquía con cuatro niveles de agrupamiento pueden distinguirse en este 
ejemplo, a saber: la variación entre comunidades autónomas (nivel de agregación superior), la variación 
entre colegios, la variación entre aulas y la variación entre alumnos (nivel de agregación inferior). 

Los diseños que utilizan diferentes niveles de agregación se llaman DISEÑOS JERÁRQUICOS (DJE) en 
la literatura experimental. Una denominación más general, y más típica de la literatura no experimental, 
es la de DISEÑOS MULTINIVEL (DMN). En cualquier caso, el tipo de datos que genera este tipo de diseños 
se denominan genéricamente DATOS DE AGREGACIÓN (clustered data). Este tipo de modelos se ha po- 
pularizado en muchas áreas de la investigación aplicada como la Psicología del desarrollo, la Psicología 
social y la Psicología de la educación. 
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La figura 7.5 presenta un diagrama del diseño jerárquico con una estructura de tratamientos de un 
factor con 2 niveles y estructura de control mediante aleatorización completa aplicado en el contexto de 
una investigación sobre psicología de la educación. Conviene precisar que las unidades experimentales 
se extraen al azar de dos tipos de aulas (aulas 1 y 3 de colegios públicos y aulas 2 y 4 de colegios privados), 
donde las aulas se suponen a su vez también seleccionadas al azar (y por consiguiente representa un 
factor aleatorio), y mantienen una relación de anidamiento con los tratamientos. La estructura de error 
es múltiple, ya que las unidades experimentales pertenecen a aulas diferentes, permitiendo distinguir 
la variación debida a las aulas (unidad experimental mayor o de nivel 2) de la variación debida a los 
alumnos (unidad experimental menor o de nivel 1). 


UNIDADES EXPERIMENTALES 
Aula 2 


ESTRUCTURA DE LOS TRATAMIENTOS 
(Sencillo 2) 


Figura 7.5. — Representación del Diseño JErárquico (DJE). 


7.2.2. Ejemplo 7.3: DJE con un factor y una variable anidada 


Utilizamos el ejemplo 7.3 (Maxwell y Delaney, 2004, p. 500) para ilustrar el diseño jerárquico con un 
factor y una variable anidada. Con el objeto de determinar si la valoración de la gravedad de un trastorno 
psicológico en un grupo de pacientes depresivos depende del sexo del entrevistador, un investigador 
seleccionó al azar a 6 alumnos (los tres primeros varones y las tres primeras mujeres que surgieron por 
azar) que participaban en un master para licenciados en psicología. A cada uno de ellos se le asignaron 
al azar a 4 pacientes a quienes debían realizar una entrevista clínica para valorar la gravedad de sus 
síntomas. Las variables explicativas implicadas son A (sexo) y B (alumno). La valoración del trastorno es 
la variable de respuesta (valor) y produjo los resultados que se exponen en el cuadro 7.3. 

El gráfico de medias de la interacción sexo x alumno se muestra en la figura 7.6. En la salida 7.15 se 
presenta un análisis descriptivo con los promedios, sumas, varianzas y número de réplicas. Obsérvese 
que la naturaleza de los dos factores hace imposible aplicar un DCA factorial cruzado. Son 6 diferentes 
alumnos (y no 3, como hubiera ocurrido de tratarse de un cruce entre variables) los que entrevistaron 
a un conjunto de 24 pacientes, y por tanto se trata de un diseño jerárquico con B anidado dentro de 
A. El diseño es también un diseño multinivel donde pacientes representa el nivel inferior de agrupa- 
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miento (tamaño menor de unidad experimental) y alumnos el nivel superior (tamaño mayor de unidad 


experimental), y por tanto el término de error es múltiple. 


CUADRO 7.4 


Datos empíricos del ejemplo 7.3 


Caso | sexo alumno | valor - | Caso | sexo alumno | valor 
1 varón all 49 13 mujer al4 53 
2 varón all 40 14 mujer al4 59 
3 varón all 31 15 mujer al4 63 
4 varón all 40 16 mujer al4 69 
5 varón al2 42 17 mujer al5 44 
6 varón al2 48 18 mujer al5 54 
7 varón al2 52 19 mujer al5 54 
8 varón al2 58 20 mujer al5 64 
9 varón al3 42 21 mujer al6 58 

10 varón al3 46 22 mujer al6 63 
11 varón al3 50 23 mujer al6 67 
12 varón al3 54 24 mujer al6 72 
65- 
60 - 
55 =; 
< 
8 sexo 
E «d: mujer 
4 DN varon 
50 - AN 
' a 
4 
4 
45- 4 
4 
4 
Y 
4 
40- A 
alu alu2 alus alus alus alu6 
alumno 


Figura 7.6. — Gráfico de la interacción sexo x alumno. 
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SALIDA 7.15 
Análisis descriptivo (ejemplo 7.3) 


Variable dependiente: valor 
Media 


Suma 


Varianza 


40.0000 
50.0000 
48.0000 


160.00 
200.00 
192.00 


54.000 
45.333 
26.667 


46.0000 


552.00 


54.727 


61.0000 
54.0000 
65.0000 


244.00 
216.00 
260.00 


45.333 
66.667 
35.333 


60.0000 


720.00 


62.667 


40.0000 
50.0000 
48.0000 
61.0000 
54.0000 
65.0000 


160.00 
200.00 
192.00 
244.00 
216.00 
260.00 


54.000 
45.333 
26.667 
45.333 
66.667 
35.333 


53.0000 


1272.00 


107.304 


La estructura del diseño jerárquico del ejemplo 7.3 se representa en el diagrama de la figura 7.7. 
Nótese que se definen inicialmente dos grupos de individuos varones y mujeres (factor A, sexo), para 
cada uno de los cuales se escogen al azar a 3 alumnos participantes en el master (factor B, alumnos) 
y a cada uno de ellos se le asignan para su evaluación también al azar a 4 pacientes. En consecuencia, 
el factor B no se cruza con A, sino que se anida dentro del factor A. Nótese que hay dos tamaños de 
unidad experimental: un tamaño menor (pacientes que son evaluados por alumnos) y un tamaño mayor 
(alumnos que se anidan dentro de género). 


varones mujeres 


- / e AS ES 
t 


alumno 2 alurgno 3 alumno 4 alumno 5 alumno 6 
Pa Ss A dl ES -, Os “0 Os -U Us 
r e ES os EU: Se PR ES y a “7 E Nx > L” ES Mx > e Y Es > 


/ 1 y S pa 1 y ES - £ N sa pd / Ñ So A 7 A Ma eS 4 Ñ sa 


P1 P2 P3 P4 P5 P6 P7 P8 P9 P10 P11 P12 p]3 P14 P15 P16 P17 P18 P19 P20 P21 P22 P23 P24 


a 


Figura 7.7. — Estructura del diseño jerárquico del ejemplo 7.3. 


La notación del diseño jerárquico B(4) para este ejemplo es DJE : 3(2),n = 4 y en su formulación 
destacamos que sexo (4) es un factor fijo mientras que alumno (B) se asume aleatorio: 


Yijk = Hjk + ij 


(7.2) 
Yije= +0 ¡+ Drj) + ijk 
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donde: 


— Y;¡¡x es el valor observado de la variable de respuesta para la ¡-ésima réplica de la ¡k-éima combi- 
nación de tratamiento. 


— pes la respuesta esperada global, que se asume constante para todas las combinaciones de trata- 
miento y todas las réplicas. 


— Hijx es la respuesta esperada para la ¡k-ésima combinación de tratamiento. 


— q; es el efecto del factor A (sexo), que se supone constante porque sus niveles son prefijados por 
el investigador. 


— by;¡) es el efecto del factor B (alumno), que se supone aleatorio porque sus niveles se han selec- 
cionado al azar de una población de alumnos y su distribución es by; y NIDO, di) 


— €jjx es el residuo o error experimental para la ¿-ésima réplica de la ¡k-éima combinación de tra- 
tamiento. Su distribución es e; je NIDO, a). 


— Se asume además que by.;, y e;;x son variables aleatorias independientes (o no correlacionadas). 


La razón que justifica la denominación de diseño jerárquico (también conocido con la denomina- 
ción genérica de diseño multinivel) es que el factor B (alumno) está anidado dentro de A (sexo) y, como 
sucede en todo diseño factorial, las unidades S (pacientes) se anidan a su vez dentro de las combina- 
ciones de alumno y sexo. La notación que se emplea para el primero es B(4), que representa «alumnos 
anidados dentro de sexo», y constituye el primer nivel (o nivel superior) de la jerarquía. La notación que 
se emplea para el segundo es S(B(4)), o simplemente Residual, que significa «pacientes anidados dentro 
de alumnos, a su vez anidados dentro de sexo», y constituye el segundo nivel (o nivel inferior) de la jerar- 
quía. Por tanto hay dos tamaños de unidad experimental: los alumnos son las unidades experimentales 
empleadas para comparar los niveles del factor sexo (unidad de tamaño menor) y los pacientes son las 
unidades de observación empleadas para comparar la valoración del factor alumnos (unidad de tamaño 
mayor). 

El cálculo de las SC para el diseño DJE : b(a) mediante la fórmula simplificada es un proceso muy 
sencillo, ya que solamente requiere definir cuatro cantidades básicas (en lugar de las cinco que requiere 
un ANOVA con dos factores). Nótese que se prescinde del cálculo de la cantidad básica [B] porque la 
suma de cuadrados para el factor B es indisociable de la suma de cuadrados para la interacción AB. 

También los grados de libertad se definen de forma muy simple a partir de las medias implicadas en 
las SC, o bien aplicando la regla básica de que las fuentes de variación que utilizan términos situados 
fuera de paréntesis restan un grado de libertad mientras los términos situados dentro de paréntesis no 
restan ninguno. Siguiendo esta regla, 


gla = (a-1)=2-1=1 


a(b-1)=2(3-1D)=4 
ab(n-D)=0M)84-D=18 


8lB(a) 


8lsiB(A) 


El cuadro 7.4 resume todo el proceso de cálculo. 
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CUADRO 7.4 
Resumen de cálculo de las Sumas de Cuadrados del DJE : b(a) 


Cantidades básicas Procedimiento de cálculo No términos 
10) =72/abn (1272)? /24 = 67416 1 
[4] =Y A%/bn (5522/12 + (720)? /4 = 68592 a=2 
[AB]=E FAB, /n | (160)%/4+...+(260)%/4=69064 | ab=6 
[R]= EX (M-DS%, (3)(54+...-+ 35.333) = 820 (n- (ab) = 18 
Sumas de cuadrados Procedimiento de cálculo Grados de libertad 
SCA =[4) - [1] 68592 - 67416 =1176 1 
SCg(a) = [AB] —[4] 69064 — 68592 = 472 4 
SCsíB(a) = [R] 820 18 
SCu =[AB]- [1] 69064 — 67416 = 1648 5 
SCr=IR] 820 18 
SCT =[AB]+[R]-[1] | 69064+820-67416 = 2468 23 


Para el ejemplo 7.3, es importante notar la diferencia entre el diseño jerárquico DJE : 3(2),n = 4 
y el diseño completamente aleatorio DCA:2x3,n= 4 equivalente. El DJE no contiene un término de 
interacción (AB) mientras que el DCA sí. Esta es la principal consecuencia de la relación de anidamiento 
del primero respecto a la relación de cruce del segundo. Sin embargo, el término de interacción está 
subsumido en el efecto factorial by; 7 del DJE, como demuestra el desarrollo de los grados de libertad: 


£glB+ glag=(b-1D)+(a-1D)(b-1)=b-1+ab-=a-b+1=ab=a=glga) 


Y como sucede en los ANOVA factoriales con efectos mixtos, las razones F dependen de la configuración 
particular de efectos fijos y aleatorios del modelo. El cuadro 7.5 desarrolla los términos del denomina- 
dor de las razones F utilizados para probar los efectos de un diseño jerárquico con un factor anidado. 
Tales términos se obtienen utilizando el algoritmo para valores esperados de las medias cuadráticas que 
expusimos en el capítulo 4. El caso correspondiente al ejemplo 7.3 es el más frecuente y se localiza en la 
tercera columna (A fijo y B aleatorio). 


CUADRO 7.5 
Denominador de las razones EF para el diseño jerárquico 
AyB A fijo, Aaleatorio, 
aleatorios | B aleatorio B fijo 


MCB(4) MC) MCr 
MCr MCr MCr 


La salida 7.16 presenta una tabla ANOVA mediante el enfoque clásico con los resultados del ajuste 
del modelo de la ecuación 7.2. Nótese que el error que corresponde para probar el efecto de A, apli- 
cando las ecuaciones del modelo no restrictivo (véase capítulo 4 y cuadro 7.5), es el componente B(4), 
o sea, alumno(género), que incluye B más la interacción AB. En consecuencia, la valoración de la gra- 
vedad de los síntomas depende del sexo (en promedio, la valoración de las alumnas es más grave que 
la de los alumnos), ya que Fa4(1,4) = 9.966, P = .034. A este respecto, es importante notar que la po- 
tencia estadística de los efectos B(4) y A no alcanza el valor mínimo recomendado de 0.80. En el pri- 
mer caso, B(4) es un efecto aleatorio, el valor crítico es F¿ = 2.928, y la razón entre F¿ y F empírica es 
RF = (2.928/2.590) = 1.131, de forma que la potencia observada es Ba) = 1- P(1.131,4,18) = 0.373 
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(ecuación 4.13). En el segundo, que es un parámetro fijo, siendo F¿ = 7.709 y Aa = 9.966, la potencia es 
$ A=1-—P(7.709,1,4,9.966) = 0.661. La investigación probablemente habría obtenido una potencia óp- 
tima para ambas pruebas (y particularmente con la segunda, que no obstante resultó estadísticamente 
significativa) si se hubiera planificado con un mayor número de unidades de nivel 2. 


SALIDA 7.16 
Tabla ANOVA del diseño jerárquico (ejemplo 7.3) 
Variable dependiente: valor 


Fuente 


SC tipo III 


MC 


Modelo 
A 


B(A) 
Residual 


1648.000 
1176.000 
472.000 
820.000 


329.600 
1176.000 
118.000 
45.556 


Total 
2MCgA)> 


2468.000 
2MCr 


A partir de la salida 7.16, los cálculos requeridos para obtener los componentes de la varianza, la 
correlación intraclase para B(4) y la estimación de la magnitud del efecto para A (véase salida 7.14) son: 


ab(MC, =- MC 6)(118 - 45.5556 
e, E (MC a) R) al (6)( ) ELE! 
N 24 
A a-=1)(MCA- MC D(1176-118 
$2 e ( JMCA B(A)) a mM ) 244.083 
N 24 
22 
Ó 
poo = _—2% 0.168 
dG PÓ La FO% 
ó 
7) a 
A = — = 0.409 
dG +Ó Lg F0% 


Es importante notar que el análisis de la salida 7.16 no se puede simplificar. Por ejemplo, no es po- 
sible eliminar el componente B(4) para ajustar un modelo más simple, al no ser significativo, porque el 
componente B(4) es en realidad una suma indisociable de los efectos de B y de Ax B. 

La salida 7.17 es una reorganización de la salida 7.16 para resaltar la existencia de dos componentes 
de error: el primero es el residual para pacientes S(B(A)), que representa el nivel 1 o tamaño menor, y el 
segundo es el residual para alumnos B(4), que representa el nivel 2 o tamaño mayor. Notese que la única 
prueba estadística de interés es la que contrasta las diferencias de medias del único factor existente, el 
factor de clasificación A, que utiliza como fuente residual el término B(4). 


SALIDA 7.17 
Tabla ANOVA clásica del diseño jerárquico como estructura multinivel 


Variable dependiente: valor 


Fuente 


SC tipo HI 


MC 


Modelo 
Nivel 2 
A 


Residual B(A) 
Nivel 1 
Residual S(B(A)) 


1648.000 


1176.000 
472.000 


820.000 


329.600 


1176.000 
118.000 


45.556 


Total 


2468.000 
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Similar, pero algo más informativa, es la salida 7.18, que representa el ajuste del mismo modelo con 
el enfoque mixto. La diferencia entre el enfoque clásico y el enfoque mixto es patente cuando en el 
diseño se introducen más niveles de agregación o no se cumplen las condiciones de regularidad. 


SALIDA 7.18 
Análisis del diseño DJE : B(A) con enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de la varianza 77.613 155.227 (4) 159.227 161.409 
Efectos aleatorios 
Parámetros Estimador | E. típico Zde Wald | P>|zl 
Varianza a 18.111 21.202 0.854 .393 
Varianza a? 45.556 15.185 3.000 .003 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 
sexo 1 4 9.966 .034 


7.2.3. Ejemplo 7.4: DJE con dos factores y una variable anidada 


La generalización del diseño jerárquico a más de un factor de tratamiento (o de clasificación) y a 
más de una variable anidada no plantea mayores problemas. En el cuadro 7.6 se resumen tres casos 
diferentes de diseño jerárquico. 


CUADRO 7.6 
Comparativa entre tres tipos de diseños jerárquicos: B(A), Ax C(B) yC(B(A) 
DJE: b(a) DJE:axc(b) DJE: c(b(a)) 
Fuentes "=. | Fuentes gl es Fuentes 
A A a-1 A 
B(A) B b-1 B(A) 
Residual AB (a-1)(b-1) C(B(A)) 
Total C(B) b(c-1) Residual 
| AxCB) | ba-D(c-D | Total 
Residual abc(n-1) 
Total abcn-1 


En comparación con el ejemplo 7.3 con un factor (tabla de la izquierda del cuadro 7.6), una de las 
posibles variaciones generadas con la ampliación a más de dos factores es un DISEÑO JERÁRQUICO PAR- 
CIALMENTE ANIDADO (tabla central del cuadro 7.6), que introduce una estructura factorial en el DJE, 
que pasaría de tener una fuente para la estructura sencilla (4) a tener tres fuentes para la estructura fac- 
torial (4, B y AB), una fuente anidada, C(B) y una interacción del primer factor con la fuente anidada 
A x C(B). La ampliación a más de una variable anidada conduce al DISEÑO JERÁRQUICO TOTALMENTE 
ANIDADO (tabla de la derecha del cuadro 7.6), que introduce una fuente de variación más en el diseño 
del ejemplo 7.3, que pasaría de tener una variable anidada, B(4), a tener dos, B(4) y C(B(4)). En los 
dos casos de generalización del diseño jerárquico básico es muy conveniente tener siempre presente la 
estructura de un ANOVA con tres factores, tanto para contabilizar las fuentes de variación como para 
calcular los grados de libertad, ya que las fuentes citadas deben ser la suma de todos los componentes 
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de la estructura factorial general del ANOVA con tres factores. Así, en el caso central del cuadro 7.7, la 
fuente C(B) es la suma de C y de BC, la fuente A x C(B) es la suma de AC y de ABC y por tanto el con- 
junto de las fuentes representa un ANOVA con tres factores. Del mismo modo sucede en el caso de la 
derecha del cuadro 7.6, donde la fuente B(4) es en realidad la suma de A y de AB y la fuente C(B(A4)) es 
la suma de C, BC, AC y ABC, que en su conjunto representa también un ANOVA con tres factores. 

El ejemplo 7.4 se tomó de una investigación cuyo objetivo era comprobar si el rendimiento en una 
tarea de anagramas dependía del sexo (factor B). Se utilizaron con tal fin a seis alumnos (factor C), tres 
varones y tres mujeres seleccionados al azar de una lista de voluntarios, quienes recibieron formación 
sobre solución de anagramas y otros seis alumnos también seleccionados al azar de la lista, que no reci- 
bieron formación (factor A, formación). Cada alumno tenía que resolver un conjunto de tres anagramas 
en un tiempo limitado. La variable de respuesta fueron las puntuaciones obtenidas en una escala de 
rendimiento de hasta 68 puntos. Los resultados obtenidos se muestran en el cuadro 7.7. 


CUADRO 7.7 
Datos empíricos del ejemplo 7.4 


formación alumno | rendim | *. | formación alumno | rendim 
Sí all 30 No all 51 
Sí all 36 No all 53 
Sí all 38 No all 56 
Sí al2 33 No al2 60 
SÍ al2 31 al2 59 
SÍ al2 35 al2 57 
SÍ al3 32 al3 49 
SÍ al3 33 al3 46 
Sí al3 al3 47 
Sí al4 al4 32 
Sí al4 al4 29 
Sí al4 al4 35 
Sí al5 al5 15 
Sí al5 al5 13 
Sí al5 al5 19 
Sí al6 al6 10 
Sí al6 al6 16 
Sí al6 al6 14 


En este caso, además del factor de anidamiento sexo (B) y del factor anidado alumno (C), hay un fac- 
tor de tratamiento formación (4) que distingue a los alumnos que reciben formación específica para la 
solución de anagramas de quienes no lo reciben. En el estudio participaron en total doce alumnos, seis 
varones y seis mujeres, que fueron elegidos al azar, la mitad de los cuales recibió formación específica 
mientras la otra mitad no recibió formación alguna. En consecuencia, se trata de un diseño experimen- 
tal jerárquico donde el factor A está cruzado con B, el factor C está anidado dentro de sexo B, y hay n= 3 
réplicas en cada combinación de los tres factores. La notación de este diseño es DJE : ax c(b),n =3, 
donde A (formación) y B (sexo) son factores fijos y C (alumno) se asume aleatorio. Nótese que mientras 
C(B) forma una estructura de anidamiento, el factor A se encuentra en relación de cruce con el factor 
B. Por esta razón, esta forma de diseño combinado de cruce y anidamiento suele también denominarse 
DISEÑO PARCIALMENTE JERÁRQUICO. Este diseño es también un DISEÑO MULTINIVEL porque los alumnos 


OEdiciones Pirámide 


Diseños intersujetos. 1: aleatorización completa 283 


se anidan dentro de sexo, C(B), constituyendo el segundo nivel de la jerarquía mientras las réplicas, o 
sea, los diferentes anagramas solucionados por cada alumno, S(C(B)), constituyen el primer nivel de 
la jerarquía. En consecuencia suponemos dos entidades de unidad experimental, el nivel superior que 
corresponde a los alumnos, y el nivel inferior que corresponde a los pacientes. 

El análisis descriptivo se ha simplificado eliminando todas las sumas totales (que tendrán que cal- 
cularse manualmente) y se muestra en la salida 7.19. 


SALIDA 7.19 
Análisis descriptivo del ejemplo 7.4 


Variable dependiente: valor 


formación sexo alumno | Media 

1.00 1.00 1.00 34.6667 
2.00 33.0000 
3.00 31.6667 
4.00 20.6667 
5.00 7.6667 
6.00 11.3333 


1.00 53.3333 
2.00 58.6667 
3.00 47.3333 
4.00 32.0000 
5.00 15.6667 
6.00 13.3333 


WWW w0|w (0 WMWjiw Y ju ww w|a 


El modelo matemático para el diseño DJE: a x c(b) se formula mediante 


Yi ji = Mjro + ijkl 


(7.3) 
Yi jr = 44 0 j+ Bj + (ab) jr + Cri) + (00) jr) + Cijkl 


donde: 


— Y;¡jxi es el valor observado de la variable de respuesta para la ¿-ésima réplica de la ¡k!-ésima 
combinación de tratamiento. 


— pes la respuesta esperada global, que se asume constante para todas las combinaciones de trata- 
miento y todas las réplicas. 


— Hjri es la respuesta esperada para la ¡kl-ésima combinación de tratamiento. 


— q; es el efecto del factor A (formación), que se supone fijo porque sus niveles son prefijados por 
el investigador. 


— PB; es el efecto del factor B (sexo), que se supone también fijo porque sus niveles son prefijados 
por el investigador. 


— (af); es el efecto interactivo de los factores A y B, que se supone también fijo porque los niveles 
de sus respectivos factores han sido prefijados por el investigador. 
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— Ci) es el efecto del factor C (alumno), que se supone aleatorio porque sus niveles se han se- 
leccionado al azar de una población listada de alumnos voluntarios. Su distribución es C;(x, — 
NID(0, 07). 


— (aC) ¡1(%) es el efecto interactivo del factor de tratamiento A con el factor C (alumno), que se supo- 
ne también aleatorio y distribuido según a:c;x, - NID(0, 0?.,. 


— €¡jx1 es el residuo o error experimental para la ¿-ésima réplica de la ¡kl-ésima combinación de 
tratamiento. Su distribución es e; ¡ki NID(O, 07). 


— Se asume además que C;(x), 4C](x) Y €¡¡x Son variables aleatorias independientes (o no correlacio- 
nadas). 


El proceso de cálculo de las SC para el diseño DJE : 2 x 3(2), n= 3 se resume en el cuadro 7.8. Nóte- 
se nuevamente que, una vez obtenidas todas las cantidades básicas requeridas, los cálculos utilizados 
para obtener las sumas de cuadrados se corresponden puntualmente con los cálculos empleados para 
obtener los grados de libertad. Así la SC para el factor A es SCA = [4] — [1] y sus grados de libertad son 
gla= a—1 yla SC para la interacción A x C(B) es SCaxc(s) = [ABC] -—[4B]-[BC] + [B] y sus grados de 
libertad son glaxc(g) = abc— ab— bc+b= b(a-1)(c— 1). En condiciones de regularidad, los grados de 
libertad pueden también obtenerse aplicando la regla general que tratamos anteriormente. De acuer- 
do con esta regla, los componentes que se presentan fuera de paréntesis restan un grado de libertad 
mientras que los que se presentan dentro de paréntesis no restan nada. Así, para la fuente A, los grados 
de libertad son gl = a— 1, los de la fuente C(B) son glc(g, = b(c—1) y los de la fuente A x C(B) son 
8laxciBy) = bla- D(c—1). 

El correspondiente análisis de varianza se resume en la salida 7.20. Nótese que las esperanzas de las 
medias cuadráticas asumiendo un modelo no restrictivo requieren utilizar MC¿(g, como denominador 
para probar el efecto de B, MCaxc(3) como denominador para probar el efecto de Ax B y de C(B) y 
MC para probar el efecto de A x C(B). 


CUADRO 7.8 
Resumen de cálculo de las Sumas de Cuadrados del DJE:2x3(2),n=3 

Cantidades básicas Procedimiento de cálculo No términos 
11=72/abn (1078)7/36 = 32280.111 1 
Al=Y A2/bcn (417)2/18 + (661)? /18 = 33933.889 a=2 
B]=E Bi/acn (776)? 118 + (302)? /18 = 38521.111 b=2 
AB] = EF ABS, /cn (298)2/9+...+(183)2/9 =40548.667 | ab=4 
BC]=Y Y BC;,/an (2602/6+...+(74)?/6 = 39471.667 bc=6 
ABC] =E EE ABCi,/n (10492/3 +... + (40)2/3 = 41645.333 abc=12 
RI=E TF FEm- DSi (217.333 +...+ 9.333) = 142.667 (n- Díabc) = 24 

Sumas de cuadrados Procedimiento de cálculo Grados de libertad 
SCa= [A] - [1] 33933.889 — 32280.111 =1653.778 1 
SCg = [B]- [1] 38521.111-32280.111 =6241.000 1 
SCag =[4B] - [4] - [B] + [1] 40548.667—...+32280.222=373.778 | 1 
SCc(s) = [BC] -—[B] 39471.667 — 38521.111 = 950.556 4 
SCaxc(s) = [ABC] [AB]-[BC]+[B] | 41645.333—--++38521.111=146.111 | 4 
SCm = [ABC] - [1] 41645.333 — 32280.111 = 9365.222 11 
SCr = [ABC] +[R] - [1] 9365.222 + 142.667 — 3 = 9507.889 35 
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SALIDA 7.20 
Análisis de varianza del diseño DJE:2x3(2),n=3 
Variable dependiente: valor 

SC tipo HI MC F 
9365.222 851.384 | 143.234 
1653.778 1653.778 | 45.275? 
6241.000 6241.000 | 26.263% 
373.778 373.778 | 10.233 
C(B) 950.556 237.639 6.506? 
AxC(B) 146.111 36.528 6.145 
Residual 142.667 5.944 
Total 9507.889 
“MCc(B), ?MCaxc(B), “MCR 


La salida 7.20 no ofrece estimaciones de los componentes de varianza para C(B) y A x C(B) ni mag- 
nitudes del efecto para cada uno de los efectos. Por el método de los momentos podemos obtener: 


be(MC, = MC 
Py _ be(MCci) ACB) _ 33.519 
N 
7) _ abc(MCacíB) = MCh) E 
em E a = 10.194 
7 = D(MCA- MC 
de (a- D z AC(B)) — 44,924 
A b- D(MCB- MC 
de. E > Cc) 166.760 
á =- 1)(b- D(MCag - MC 
82, _ (a- D( y a AC(B)) - 9.368 


La estimación de la varianza total es: 57 = 270.7085, las estimaciones de omega cuadrado para los efec- 
tos fijos son: 0 = $a/6% = 0.166, 0% = ¿glo? = 0.616 y De = Sap/ó% = 0.034, y los coeficientes de 


correlación intraclase son: a = ip) 10%, = 0.124 y pa = if JO% = 0.038. 


La salida 7.21 es una reorganización de la salida 7.20 para facilitar la comprensión del diseño. 


SALIDA 7.21 
Análisis de varianza del diseño DJE:2x3(2),n=3 con estructura multinivel 
Variable dependiente: valor 
Fuente SC tipo III MC F 
Modelo 9365.222 851.384 143.234 
Nivel 2 
B 6241.000 6241.000 | 26.263% 


Residual C(B) 950.556 4 237.639 
Nivel 1 


A 1653.778 1653.778 45.275? 

AB 373.778 373.778 10.233? 

AxC(Bb) 146.111 4 36.528 6.145€ 
Residual S(C(B)) 142.667 5.944 
Total 9507.889 
“MCc(3)» "MCaxci5) “MCr 
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Se destacan dos niveles correspondientes a cada una de las entidades/tamaños de unidad experi- 
mental existentes. El nivel 2 (tamaño mayor de unidad experimental) corresponde a diferencias entre 
alumnos, cuyo componente residual C(B) se utiliza para probar el efecto del factor B bajo los enfoques 
restrictivo y no restrictivo. El nivel 1 (tamaño menor de unidad experimental) corresponde a diferencias 
en rendimiento de cada alumno con los tres anagramas, cuyo componente residual S(C(B)) se utiliza 
como denominador para probar los efectos C(B) y A x C(B) bajo el enfoque restrictivo y la interacción 
A x C(B) bajo el enfoque no restrictivo. A su vez, la interacción A x C(B) se utiliza como denominador 
para probar los efectos de A y AB bajo el enfoque restrictivo y los efectos de A, AB y C(B) bajo el enfoque 
no restrictivo. 

Finalmente, la salida 7.22 es la salida del enfoque mixto, que ofrece en su conjunto información simi- 
lar, pero más específica, que una salida clásica de ANOVA como la de las salidas 7.20 y 7.21. La interpre- 
tación de los efectos fijos utiliza el principio de marginalidad apuntando que la interacción formación 
x sexo es estadísticamente significativa. Los efectos aleatorios presentan una magnitud moderada para 


22 A 22 
cp Y baja para cp)" 
SALIDA 7.22 
Análisis de varianza del diseño DJE:2 x 3(2),n=3 con enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Componentes de la varianza 89.327 178.655 (6) 184.512 189.052 
Efectos aleatorios 
Parámetros Estimador | E. típico Zde Wald | P>|zl 
Varianza Ep) 33.519 28.335 1.183 .237 
Varianza Tacf) 10.194 8.629 1.181 237 
Varianza 0% 5.944 1.716 3.464 .001 
Efectos fijos 
Fuentes de variación 8 lnum 8lden F P>F 
formación (A) 1 4 45.275 .003 
sexo (B) 1 4 26.263 .007 
formaciónxsexo (AB) 1 4 10.233 .033 


7.3. EJEMPLOS DE DISEÑOS INTERSUJETOS CON ALEATORIZACIÓN 
COMPLETA 


Los diseños completamente aleatorios fueron muy comunes en la investigación psicológica aplicada 
durante el siglo pasado, pero desde el desarrollo y auge de los diseños de medidas repetidas su empleo 
ha decaído considerablemente. 

King y Napa (1998) examinaron el concepto de buena vida en una serie de dos experimentos con dos 
muestras de estudiantes de instituto (experimento 1) y de adultos no estudiantes (experimento 2). En el 
primer experimento utilizaron 104 estudiantes a los que se les mostró una encuesta que había sido con- 
testada por una persona valorando su propia ocupación. Después de leer la encuesta, los participantes 
juzgaron el atractivo y bondad moral de la vida de quien completó la encuesta en función de la cantidad 
de felicidad (alta versus baja), el significado de la vida (alto versus bajo) y su situación económica (alta 
versus baja). Los investigadores utilizaron un DCA factorial 2x2x2 y varias medidas de respuesta rela- 
tivas a la vida de la persona valorada en la encuesta. Los datos se analizaron mediante MANOVA. Los 
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resultados revelaron efectos significativos de la felicidad y el significado de la vida sobre el atractivo y la 
bondad moral, pero no de la situación económica. Para la muestra de estudiantes, los individuos altos 
en las tres variables se juzgaron como merecedores de mejor vida. Para la muestra de adultos, la mejor 
situación económica se asoció además con mayor atractivo. 

Es importante destacar la escasa o nula atención que los estudios publicados conceden al principio 
de marginalidad y a la presencia y tratamiento de valores perdidos. Por ejemplo, en una interesante in- 
vestigación de Briñol, Becerra, Gallardo, Horcajo y Valle (2004), con una muestra de 92 estudiantes, se 
utilizaron varios DCA 2x2 con dos variables dependientes, para la primera de las cuales el único efecto 
significativo encontrado fue el efecto principal del factor A, con F4(1,80) = 25.95; P < .01 (pero se es- 
peraban 88 grados de libertad residuales para el modelo interactivo o bien 89 para el modelo aditivo) y 
para la segunda un efecto principal del mismo factor, con F1(1,84) = 14.10; P <.001 y un efecto interac- 
tivo, con F4g (1,84) = 4.10; P < .05 (pero se esperaban 88 grados de libertad para el componente residual 
en ambos casos). Muchos autores no suelen informar de la naturaleza y la relevancia de los datos per- 
didos, pero conviene recordar que dependiendo de la naturaleza de los datos perdidos la interpretación 
de los resultados puede ser drásticamente diferente. Además, en este trabajo se pasa por alto también 
el principio de marginalidad porque para el mismo diseño se reporta un efecto principal y un efecto 
interactivo. Pero es muy importante advertir (véase Nelder, 1977) que los efectos principales carecen de 
sentido interpretativo en presencia de una interacción de primer orden significativa. 

Junco, Heibergert y Loken (2010) exploraron el impacto de los medios sociales en la actividad acadé- 
mica de los estudiantes. Diseñaron con esta finalidad un experimento para determinar si el uso de Twit- 
ter con propósitos educativos puede influir en el compromiso y el aprendizaje de los estudiantes. Se 
emplearon 125 estudiantes de 7 clases que seguían estudios de grado en el área de las Ciencias de la 
Salud, de los que 70 estudiantes de 4 clases fueron aleatoriamente asignados a un grupo experimental 
(quienes después de un breve aprendizaje usaron Twitter para tareas y discusiones de carácter acadé- 
mico) y los restantes 55 estudiantes de otras 3 clases diferentes fueron asignados a un grupo de control 
(que no usó Twitter). El compromiso académico fue evaluado con la escala National Survey of Student 
Engagement, que se registró con un pretest antes del experimento y con un postest 14 semanas después. 
La variable de respuesta fue la diferencia entre las puntuaciones de postest y pretest. El correspondiente 
diseño jerárquico (estudiantes anidados dentro de clases) demostró que los estudiantes se implicaron 
en el proceso de aprendizaje hasta un punto que trascendió sus actividades rutinarias, produciendo evi- 
dencia empírica de que el uso de Twitter puede ser utilizado como instrumento educativo para movilizar 
a los estudiantes a desempeñar un papel más activo y más participativo en actividades académicas. 

En el diseño jerárquico utilizado en la investigación anterior solo intervienen dos variables. Diseños 
más complejos son más comunes en la literatura. Un ejemplo ilustrativo es un trabajo de Wilke, Hut- 
chison, Todd y Kruger (2006) sobre el efecto de la conducta de riesgo en la elección de pareja. Estudios 
anteriores habían asumido que la conducta de riesgo era en general atractiva para la pareja. La investi- 
gación utilizó estudiantes universitarios que cursaban grados diferentes en Alemania (60 participantes) 
y Estados Unidos (140 participantes) y valoraron cada uno de 40 ítems correspondientes a actividades de 
riesgo de seis diferentes dominios (recreativo, ético, juego, inversión, social y salud) en una escala Likert 
bipolar de 5 puntos. En el diseño jerárquico resultante se definieron como fuentes de variación: do- 
minio, ítem(dominio), sexo, sujeto(sexo), dominio(sexo), sexox ítem(dominio), dominio x sujeto(sexo) y 
error residual, donde ítems y sujetos eran factores aleatorios y los restantes fijos. Los resultados fueron 
relativamente similares en las dos culturas. Los investigadores demostraron que la conducta de riesgo 
dependía del dominio (más atractivo en temas recreativos y menos en temas de salud, ético e inversión) 
y que el sexo no tuvo ningún efecto sobre el nivel global de atracción hacia la conducta de riesgo. 
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Muchos diseños intersujetos suelen emplear covariantes como variables de control. Un ejemplo re- 
ciente puede consultarse en un trabajo de Gallardo, Clavijo y Ramos (2014) en el que se planteó que 
las actitudes resultantes de mensajes cuyo contenido apela a creencias de orden afectivo o cognitivo 
dependen de la base actitudinal y de la cantidad de elaboración cognitiva que las personas dedican a 
la información que reciben. Con este objetivo se utilizaron 128 estudiantes voluntarios de la Facultad 
de Psicología de la Universidad de Talca (Chile), que fueron asignados aleatoriamente a cada una de las 
combinaciones de un diseño intersujetos factorial 2 (tipo de mensaje: afectivo versus cognitivo) x 2 (ba- 
se actitudinal: afectiva versus cognitiva) x 2 (probabilidad de elaboración: baja versus alta). Se tomaron 
como variables de respuesta las puntuaciones en una escala de 4 ítems para medir las actitudes hacia 
el reciclaje, antes y después de recibir un mensaje persuasivo. Para analizar los datos se empleó análisis 
de covarianza tomando como covariante la medida de actitud previa al mensaje. El resultado más in- 
teresante fue la interacción de segundo orden marginalmente significativa: F(1, 119) = 3.83; P = .053. El 
diseño empleado en este trabajo es por su naturaleza un DC A, pero se empleó también una covariante 
como variable controlada mediante control estadístico, con el objeto de reducir la varianza de error y 
realizar inferencias sobre las medias ajustadas del efecto de la covariante. En el capítulo siguiente, de- 
dicado a los diseños intersujetos con reducción del error residual, presentamos este diseño particular, 
y en general cualquier diseño que utilice covariantes, bajo la denominación de DISEÑO CON VARIABLES 
CONCOMITANTES. 


7.4. SUGERENCIAS DE ESTUDIO 


Más detalles acerca del diseño completamente aleatorio y el diseño jerárquico puede encontrarse en 
cualquier texto avanzado sobre diseño y análisis de experimentos. Particularmente relevantes son Cobb 
(1998); Hinkelman y Kempthorne (2005,2008); Keppel y Wickens (2004); Kirk (2013); Maxwell y Delaney 
(2004); Myers et al. (2010); Tabachnik y Fidell (2006), y Winer et al. (1991). 

Para la problemática de los valores perdidos recomendamos Acock (2005) y Graham (2009) para 
un abordaje introductorio, Allison (2000) para un tratamiento aplicado y Graham (2012), Little y Rubin 
(2002) y Molenberghs y Kenward (2007) para un tratamiento en profundidad. Un trabajo muy didáctico 
y actualizado sobre esta temática es el de Van Gilkel y Kroonenberg (2014). 

La perspectiva del modelado multinivel se presenta en un breve, pero suficiente, trabajo de Nezlek 
(2008) para el área de la psicología social y de la personalidad. En español una breve introducción al 
modelado multinivel con SPSS puede consultarse en Pardo, Ruiz y San Martín (2007). Una presenta- 
ción didáctica muy asequible puede encontrarse en Bickel (2007). Obras de referencia generales sobre 
análisis multinivel son los de Goldstein (2011), Hox (2010), Raudenbush y Bryk (2002) y Snijders y Bosker 
(2012). Tratamientos orientados al uso de software específico de los modelos multinivel pueden encon- 
trarse en Goldstein (2011), para MLW IN, Heck, Thomas y Tabata (2010), para SPSS, Littell et al. (2006), 
para SAS, Rabe-Hesketh y Skrondal (2012a,b), para STATA, Pinheiro y Bates (2000), para R/S, y West et 
al. (2015) para todos los sistemas. 

En español, la referencia clásica sobre el diseño de experimentos en Psicología es el todavía vigente 
texto del profesor Arnau (1986). Los textos de Anguera et al. (1995), Ato y Vallejo (2007), Balluerka y 
Vergara (2002) y Palmer (2011) presentan un tratamiento similar. 
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8.1. INTRODUCCIÓN 


El principal inconveniente del DCA es que requiere homogeneidad de las unidades experimentales. 
Sin embargo, en experimentos con participantes humanos siempre cabe encontrar cierto grado de he- 
terogeneidad. A medida que se incrementa la heterogeneidad se incrementa la varianza de la variable 
de respuesta en el conjunto de unidades a las que se asignan un tratamiento y como consecuencia la 
varianza residual se infla en exceso y la potencia de la prueba F para probar el efecto de tratamiento 
disminuye. Y puesto que la MC es el término que se toma como denominador de las razones F en 
un modelo de efectos fijos, cuanto mayor sea la MC menor sensibilidad tendrá el experimento para 
detectar la presencia de los efectos de tratamiento. En consecuencia, el esfuerzo del investigador debe 
concentrarse en la reducción de la varianza de error experimental para contrarrestar la heterogeneidad 
natural de las unidades experimentales y la pérdida de potencia de las pruebas estadísticas. 

Si se conoce alguna de las causas de la heterogeneidad, una solución efectiva en muchos casos con- 
siste en utilizar la técnica del CONTROL EXPERIMENTAL a la que aludimos en el capítulo 6. Esta técnica 
trata de controlar una (o más) de las variables extrañas que pueden ser causantes de la heterogeneidad 
mediante una clasificación previa de las unidades experimentales en grupos homogéneos, llamados 
BLOQUES, y la asignación aleatoria posterior de los tratamientos a las unidades experimentales dentro 
de cada bloque. La variable extraña que se controla por este procedimiento, que suele tener naturaleza 
categórica, se denomina VARIABLE DE BLOQUEO y la técnica específica de control experimental se lla- 
ma BLOQUEO O ESTRATIFICACIÓN. Cuando la estructura de los tratamientos implica un factor con dos 
niveles, la técnica de control que suele aplicarse es alguna forma de EMPAREJAMIENTO (matching). 

Una solución alternativa al control experimental es el CONTROL ESTADÍSTICO. Esta técnica incorpora 
una (o más) variable(s) controladas (o COVARIANTE/S), que suele ser de naturaleza numérica y supues- 
tamente causante(s) de la heterogeneidad, como una nueva variable del diseño básico. El efecto que se 
persigue es el mismo que el del control experimental, o sea, reducir la varianza de error para hacer más 
sensible el efecto de tratamiento. El resultado son los DISEÑOS CON VARIABLES CONCOMITANTES. 


8.2. EL DISEÑO DE BLOQUES ALEATORIOS 


Con respecto al DCA, donde la asignación aleatoria de tratamientos a unidades experimentales se 
realiza sin ningún tipo de restricción, mediante un proceso de ALEATORIZACIÓN COMPLETA, en el DISE- 
ÑO DE BLOQUES ALEATORIOS (DBA) se realiza la asignación de tratamientos a unidades experimentales 
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en función del conjunto (o bloque) al que la unidad pertenece, y por ello se realiza con una restricción, 
mediante un proceso de ALEATORIZACIÓN RESTRINGIDA. Esta es la razón por la que el DBA, para dife- 
renciarlo del DC A, recibe también el nombre de DISEÑO DE ALEATORIZACIÓN RESTRINGIDA. 

El cuadro 8.1 ilustra la comparación entre el DCA y el DBA más simple. En el primero, la asignación 
de los tratamientos a las unidades experimentales se realiza siguiendo un orden aleatorio, por ejemplo, 
en función del orden de llegada de los sujetos al experimento. Así, el primer tratamiento se asigna al 
sujeto 1 (S1), el segundo a 82, etc. En el segundo la asignación de los tratamientos a las unidades expe- 
rimentales tiene lugar una vez que el investigador ha clasificado las unidades en bloques homogéneos. 
Así, al primer bloque pertenecen las unidades S2, S8 y S11, y por ejemplo el primer tratamiento se asigna 
por azar a S2, el segundo a S11 y el tercero a S8, también por azar, etc. 


CUADRO 8.1 
Comparativa entre el DCA y el DBA 


DCA DBA 
Factor A Factor A 


al Bloques al 
S2 b1 S11 


S5 b2 S6 
S8 b3 S1 
b4 S9 


El DBA más simple contiene un factor de clasificación (la variable de bloqueo) y un factor de trata- 
miento. El DBA es en esencia el resultado de combinar una estructura de control de bloques aleatorios 
con una estructura de tratamientos en un sentido y un tamaño único de unidad experimental y su gene- 
ralización puede producirse o bien ampliando la estructura de control o bien la ampliando la estructura 
de los tratamientos, pero manteniendo en todo caso la separación entre ambas estructuras: 


— En el primer caso, pueden incluirse dos (o más) factores de clasificación, produciendo los DISE- 
ÑOS DE DOBLE BLOQUEO (porque tienen dos factores de clasificación), DISEÑOS DE TRIPLE BLO- 
QUEO (que tienen tres factores de clasificación), etc. Sin embargo, estos diseños son escasamente 
utilizados en la investigación psicológica porque requieren un número excesivo de unidades ex- 
perimentales. Una reducción notable en el número de unidades experimentales se consigue con 
el DISEÑO DE CUADRADO LATINO (DCL), en el que dentro de una estructura de doble bloqueo se 
inserta un factor de tratamiento. Pero pese a sus ventajas en tiempo y economía, el DCL es un 
diseño poco frecuente en la investigación aplicada. 


— En el segundo caso, se pueden combinar dos (o más) factores de tratamiento con un factor de blo- 
queo, produciendo los diseños DBA FACTORIALES, que pueden tener además factores en relación 
de cruce o en relación de anidamiento. 


Por otra parte, los DBA difieren también en el número de réplicas por tratamiento utilizadas. Es ob- 
vio que en el DBA un bloque compuesto por tantos individuos como niveles de tratamiento constituye 
una réplica completa del experimento. Cuando cada bloque está compuesto por un número de unida- 
des experimentales que es múltiplo del número de tratamientos, entonces el experimento contiene más 
de una réplica. En el primer caso se producen los DBA NO REPLICADOS, que son DBA con una réplica 
por combinación de bloques por tratamientos, y en el segundo los DBA REPLICADOS, O DBA con más 
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de una réplica por combinación. Los modelos estadísticos requeridos para los DBA replicados son mo- 
delos ANOVA factoriales, paralos DBA no replicados se requiere una forma especial de ANOVA en dos 
sentidos que tratamos más adelante. 

Una denominación más exacta para el DBA es DISEÑO DE BLOQUES ALEATORIOS COMPLETOS porque 
se asume que el número de unidades experimentales para un bloque determinado es igual al número 
de tratamientos, o es múltiplo del número de tratamientos. Pero también puede ocurrir que el número 
de unidades experimentales sea menor que el número de tratamientos, en cuyo caso el resultado es el 
DISEÑO DE BLOQUES ALEATORIOS INCOMPLETOS, que no serán tratados aquí. Box, Hunter y Hunter (2005) 
y Kirk (2013) tienen más información sobre este tipo de diseños. 

Las figuras 8.1a y 8.1b presentan sendos diagramas del DBA completo no replicado y del DBA in- 
completo no replicado. En ambos casos, la estructura de los tratamientos es factorial 2x2, donde las 
unidades experimentales se han clasificado previamente en 4 bloques y los tratamientos se han asig- 
nado al azar a las unidades dentro de cada bloque. Sin embargo, en el primer caso hay tantas unidades 
experimentales como tratamientos y en el segundo hay una unidad menos por bloque. Nótese que hay 
una tonalidad diferente para distinguir las unidades experimentales de cada una de las categorías de la 
variable de bloqueo. En consecuencia, la estructura de control es experimental (en concreto, bloqueo 
con aleatorización restringida) y la estructura del error es única porque no hay más que un tamaño o 
nivel de unidad experimental. 

La notación que seguiremos para el DBA es similar a la que seguimos para los DCA. El diseño con 
un factor de tratamiento y un factor de bloqueo es DBA: a x b, donde b son los niveles del factor de 
clasificación (se colocan siempre en último lugar porque no son el objetivo primario en el diseño) y 
el diseño con un factor de bloqueo y dos factores de tratamiento es DBA: ax b x c, donde c son los 
niveles del factor de clasificación. Además, dada la diferenciación que se establece entre diseños no 
replicados y replicados, incluimos también el número de réplicas cuando el diseño es replicado y se 
emplea n= 1 cuando el diseño s no replicado. Así, DBA: ax b,n= 1 representa un diseño no replicado, 
mientras que DBA: axb, n= 3 representa un diseño replicado con tres réplicas por combinación bloque 
x tratamiento. 


UNIDADES EXPERIMENTALES 


ALEATORIZACION | 


paa] 


ESTRUCTURA DE LOS TRATAMIENTOS 
Factorial 2 x 2) 


Figura 8.1a. — Representación del Diseño de Bloques Aleatorios completos no replicado (DBA). 
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UNIDADES EXPERIMENTALES 


ESTRUCTURA DE LOS TRATAMIENTOS 
(Factorial 2 x 2) 


Figura 8.1b. — Representación del Diseño de Bloques Aleatorios incompletos no replicado (DBAJ). 


8.2.1. Criterios de bloqueo 


El propósito del bloqueo es clasificar las unidades experimentales en grupos dentro de los cuales 
los elementos son homogéneos respecto a la variable de respuesta, pero al mismo tiempo evitando que 
la clasificación cambie de alguna manera el efecto de tratamiento. Cuando solo hay dos tratamientos 
a administrar, suele utilizarse alguna forma de EMPAREJAMIENTO INDIVIDUAL (véase capítulo 6, Sección 
6.2.2), por el que, para cada unidad experimental, se trata de buscar otra unidad experimental asociada 
que presente las mismas características en todas aquellas variables extrañas que se desean controlar. 
Cuando hay más de dos tratamientos, el EMPAREJAMIENTO GRUPAL es más efectivo. 

El empleo de la técnica del bloqueo o del emparejamiento requiere por parte del investigador una 
habilidad especial para seleccionar las variables extrañas que servirán para reducir la varianza de error. 
La experiencia anterior en el tema puede ser crucial para sugerir variables de bloqueo efectivas. 

Kutner et al. (2005) consideran dos criterios básicos para seleccionar variables apropiadas para el 
bloqueo o emparejamiento. En primer lugar, el bloqueo o emparejamiento basado en características 
asociadas con la unidad experimental. Si las unidades experimentales son sujetos, se tratará de va- 
riables de naturaleza individual, tales como sexo, edad, inteligencia, educación, actitudes, etc.; si las 
unidades experimentales son unidades de agregación superior, tales como colegios, hospitales u otros 
agrupamientos, se tratará de variables de naturaleza grupal, tales como área geográfica (rural-urbano), 
comunidad autónoma, nivel de privacidad (público o privado), etc. En segundo lugar, el bloqueo o em- 
parejamiento basado en características asociadas al contexto de investigación, en cuyo caso se tratará de 
variables relevantes tales como observadores, instrumentos de medida, tiempo de procesamiento, etc. 


8.2.2. Ventajas e inconvenientes del DBA 


Kutner et al. (2005) y Myers et al. (2010) destacan entre las principales ventajas del DBA en compa- 
ración con el diseño DCA básico las siguientes: 
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— Si se realiza un bloqueo efectivo, el DBA proporciona resultados más precisos que el DCA de 
tamaño comparable porque reduce la variabilidad de la variable de respuesta y permite aumentar 
la potencia de la prueba F para el tratamiento. 


— Supone un control efectivo de la heterogeneidad de las unidades experimentales. 
— Puede acomodar cualquier número de tratamientos y de réplicas. 


— Es un diseño flexible con respecto al equilibrio de las réplicas por tratamiento. Por ejemplo, sería 
posible considerar un DBA para un factor de tratamiento con 3 niveles, dos grupos experimen- 
tales y uno de control, donde se contemplen bloques compuestos por 4 unidades experimentales 
que finalmente se asignan al azar una a cada GE y dos al GC. 


— El DBA replicado admite observaciones perdidas dentro de un bloque, pero al menos una réplica 
por bloque es necesaria. 


Entre sus desventajas cabría destacar las siguientes: 1) la reducción en grados de libertad para la fuente 
Residual disminuye la sensibilidad del experimento si la suma de cuadrados explicada por la variable 
de bloqueo no compensa la pérdida de grados de libertad; 2) las observaciones perdidas dentro de un 
bloque en DBA no replicados plantean problemas de análisis muy complejos, y 3) el DBA requiere el 
cumplimiento de más supuestos que el DCA equivalente. 


8.3. EL ANÁLISIS ESTADÍSTICO DEL DBA 


El análisis estadístico del DBA utiliza un modelo matemático que combina el análisis separado del 
factor o factores que componen la estructura de los tratamientos y del factor o factores que componen 
la estructura del control (Milliken y Johnson, 2009). En la combinación más simple posible (un factor de 
bloqueo y un factor de tratamiento) requiere un modelo aditivo de dos factores. Es conveniente advertir 
que en un DBA los dos factores no tienen el mismo estatus: mientras que el factor de tratamiento es el 
objeto analítico fundamental, el factor de clasificación o bloqueo se utiliza con el objeto de controlar 
la heterogeneidad de las unidades experimentales, y con tal finalidad no suele ser objeto de análisis (a 
menos que el factor tenga interés intrínseco para el investigador). En general, se asume una correlación 
de moderada a alta entre el factor de clasificación (factor B) y la variable de respuesta Y (de Rgy > .45), 
para que el control experimental se considere efectivo. 

En consecuencia, un nuevo supuesto se requiere para analizar los datos de un DBA. Además de los 
supuestos básicos del DCA (normalidad, homogeneidad de las varianzas u homocedasticidad e inde- 
pendencia de las observaciones), el DBA incorpora el supuesto de NO INTERACCIÓN ENTRE BLOQUES 
Y TRATAMIENTOS. Este supuesto es de naturaleza similar al de HOMOGENEIDAD DE LAS PENDIENTES DE 
REGRESIÓN del ANCOVA y solamente puede comprenderse cuando se distingue la estructura del control 
y la estructura de los tratamientos. En consecuencia, el diseño DBA asume un modelo aditivo entre el 
factor (o factores) de bloqueo y el factor (o factores) de tratamiento. 

Por otra parte, en muchas investigaciones psicológicas el factor de clasificación es fijo, porque sus 
niveles se definen de forma arbitraria por el investigador, pero en otras representa un efecto aleatorio. En 
el primer caso, el factor de clasificación suele tener interés explícito para el investigador. En el segundo, 
no tiene otro interés para el investigador que el de conseguir una reducción efectiva de la varianza de 
error. Del mismo modo, la variable de tratamiento puede definirse como efectos fijos o aleatorios. Esto 
supuesto: 
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— En el DBA no replicado con un factor de tratamiento y un factor de clasificación, las fuentes de 


variación y los grados de libertad corresponden a un modelo interactivo, puesto que se supone 
una interacción entre ambos, y el término residual es la suma del término de error más el término 
de interacción, e; elije (a:6) jke Obviamente, la existencia de interacción viola el supuesto de 
independencia entre las estructuras de tratamiento y error. Para verificar este supuesto se emplea 
la PRUEBA DE ADITIVIDAD propuesta por Tukey (1949). Además, si existiera interacción, la prueba 
F4 podría resultar negativamente sesgada o incluso no ser susceptible de prueba para el modelo I 
(efectos fijos), como muestran las E(MC) para el enfoque no restrictivo del cuadro 8.2. 


CUADRO 8.2 
Fuentes de variación, grados de libertad y E[MC) del DBA no replicado (modelo no restrictivo) 


Bloques fijos Bloques aleatorios 


Fuentes gl Afijo (D | Aaleatorio (II) A fijo (III) Aaleatorio (ID) 
Z 2 2 2 


A (Tratamientos) (a—1) a? + bO? a? +0Lgt bo? O¿+OL + bo? a+ das + bo 


B (Bloques) (b—-1) a? + 40? a? + og + a0; a + Dl + ad a + re + ací, 
AB (Residual) (a-D(b-1) a +0? a? + ap a? + se a? + Cir 


ab 
Total ab-1 


Nótese que la fuente Residual no es un término de error puro, ya que subsume la interacción Ax B 
y el error residual. Como consecuencia de lo anteriormente dicho, la prueba F4 = MCA/MCp re- 
sulta negativamente sesgada con el modelo I, y también con el modelo III (A fijo y bloques aleato- 
rios) asumiendo un enfoque no restrictivo para desarrollar las E(MC). En los cuatro casos restan- 
tes la prueba Fa es válida, aunque menos sensible que la obtenida cuando no existe interacción. 


Del mismo modo se define el DBA factorial no replicado con dos factores de tratamiento (A y B) 
y un factor de bloqueo o clasificación (C), que se representa en el cuadro 8.3, cuyas fuentes de 
variación y grados de libertad son, para dos de las posibles combinaciones de efectos factoriales 
(A y B fijos y A y B aleatorios), las que corresponden a los factores de tratamiento (A y B) y su 
interacción (A x B) para la estructura de los tratamientos y el factor de bloqueo para la estructura 
del control, que se asume también fijo. La SCz no es una fuente de error puro, sino contaminada 
con la interacción entre la estructura de los tratamientos y del control. En este contexto, se hace 
también preciso verificar la veracidad del supuesto de independencia entre ambas estructuras 
que se asume en este diseño, mediante la prueba de aditividad de Tukey. El cuadro 8.3 resume las 
E(MO) del DBA factorial no replicado con los modelos 1 y II. 


CUADRO 8.3 
Fuentes de variación, grados de libertad y E(MC) del DBA factorial no replicado 


Fuentes Ay B fijos (I) Ay B aleatorios (ID) 
Tratamientos 


a+ bc0? a+ 1 + py +bco? 


2 2 2 


a+ ac0? 06+CO 2 


ab aby 


pa A 2 2 2 2 2 
(a- 1D)(b-1) T+C0, y ¿+ O py CO, 


C (Bloques) c-1 0 + dd 0 + aby + aboz 
Residual (ab=D(c—-1) o+0 TFT py 


aby 
Total abc-1 


2 


+0 +acos, 
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— El modelo aditivo para un DBA replicado tiene las mismas fuentes de variación, grados de liber- 
tad y esperanzas de medias cuadráticas que el DBA no replicado, pero los grados de libertad para 
la fuente Residual difieren, puesto que se incorporan dos o más réplicas (n) por cada combina- 
ción de bloque por tratamiento. Al modelo aditivo se llega probando primero si la interacción 
bloquesxtratamientos es significativa, puesto que el modelo interactivo incluye la fuente de in- 
teracción dentro del mismo. Asumiendo la interacción no significativa, las fuentes de variación, 
grados de libertad y E(MC) para el modelo aditivo se muestran en el cuadro 8.4. 


CUADRO 8.4 
Fuentes de variación, grados de libertad y E[MC) del DBA replicado 


Bloques fijos Bloques aleatorios 
Fuentes gl j A aleatorio j A aleatorio 
A (Tratamientos) (a—-1) a + bnoZ a. + bnoZ 


B (Bloques) (b- 1) 


Residual abn-a-b+1 0% 0% 
Total abn-1 


Lo mismo sucede con el DBA factorial. El modelo interactivo completo incluye todas las fuentes 
de interacción que deben primero someterse a prueba porque su inclusión violaría el principio 
de independencia entre la estructura de tratamientos y la estructura de control. Asumiendo in- 
dependencia entre las estructuras referidas, el cuadro 8.5 presenta las E(MC) del modelo aditivo 
para el DBA factorial replicado con C aleatorio para los modelos II (todos los efectos aleatorios) y 
TIT (A y B fijos, C aleatorio) y enfoque no restrictivo. Obsérvese que, sea cual sea la estructura que 
se presente, las razones FA resultarán siempre insesgadas. 


CUADRO 8.5 
Fuentes de variación, grados de libertad y E(MC) del DBA factorial replicado 


Fuentes gl Ay Bfijos (IID | AyB aleatorios (ID) 
Tratamientos ab-1 


(a—1) 02+nbc0?, a+ neo”, +nbco? 


y 2 2 2 2 
(b-1) o¿+nacos O¿+NCO”, +NAcos, 


b 


(a-D(b-1) o7+nc0% o5+ncos 


C (Bloques) (c-1) a + nabo? a? + nabo? 
Residual (aben— ab—-c+1) a a 


Total abcn-1 


Obviamente, si no se cumple el supuesto de independencia entre tratamientos y bloques, el dise- 
ño debe incorporar las fuentes de variación adicionales relativas a la interacción (AC, BC y ABC). 
El análisis se complica en este caso y la interpretación de los resultados puede resultar bastante 
problemática, por lo que no trataremos este caso aquí (véase, no obstante, Milliken y Johnson, 
2009; Kuehl, 2001). 


En consecuencia, en los DBA sencillos o factoriales el modelo que se supone óptimo es el modelo 
aditivo, que asume que no existe interacción entre estructura de tratamientos y estructura de control. 
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La violación de este supuesto debe ser sometida inicialmente a prueba mediante ajuste condicional de 
modelos, comparando el modelo aditivo con el modelo no aditivo. La prueba directa de no significación 
del componente interactivo sólo es viable con DBA replicados. En el caso de DBA no replicados se 
emplea la PRUEBA DE ADITIVIDAD para comprobar indirectamente el cumplimiento de este supuesto. 

Por otra parte, hay un debate abierto con relación a si los bloques deben ser fijos o aleatorios. Al- 
gunos autores consideran que los bloques deben tomarse como aleatorios si los niveles utilizados re- 
presentan a toda la población de niveles del factor de bloqueo a la que se desea generalizar el efecto de 
tratamiento (véase Littell ef al., 2006, p.18). A menos que se manifieste lo contrario, es el criterio que 
seguiremos en este texto. 


8.3.1. DBAreplicado 


Utilizamos el ejemplo 8.1 para ilustrar el DBA replicado. Se pretende probar la eficacia de tres pro- 
cedimientos motivacionales (factor A) para realizar una tarea cognitiva compleja en una población de 
estudiantes universitarios, a saber, recompensa económica (nivel a1), recompensa verbal (nivel a2) y sin 
recompensa (nivel a3). Anteriores estudios apuntaron que la ejecución en la tarea presenta una amplia 
variación y que una de las variables responsables es el nivel de inteligencia. Basándose en estos estu- 
dios, el investigador decidió clasificar previamente a una amplia muestra de estudiantes en función de 
las puntuaciones en un test de inteligencia (factor B) en cinco niveles, que variaban desde puntuaciones 
altas en el test (nivel b1) hasta puntuaciones bajas (nivel b5). Después seleccionó al azar a 6 sujetos de 
cada nivel de inteligencia y los asignó al azar a los tratamientos. La variable de respuesta fue el tiempo 
mínimo en minutos (tmin) requerido para realizar la tarea satisfactoriamente. 

Los datos empíricos se muestran en el cuadro 8.6 en una tabla de contingencia de Tratamientos (4) 
por Bloques (B). El correspondiente análisis descriptivo se exhibe en la salida 8.1. 


CUADRO 8.6 
Datos empíricos del ejemplo 8.1 
Bloques (B) 
Tratamientos (4) | bl (alto) | b2 | b3 | b4 | b5 (bajo) 
al 5 
(económica) 
al 
(verbal) 
a3 


(no recompensa) 


El diseño resultante es pues un DBA con un factor de tratamiento fijo (los tres procedimientos mo- 
tivacionales, factor A) y un factor de bloqueo aleatorio (el nivel de inteligencia, factor B). Se combina 
una estructura de tratamientos en un sentido con una estructura de control mediante bloqueo simple y 
se utiliza un solo tamaño de unidad experimental. Puesto que seis sujetos de cada nivel de inteligencia 
se asignaron al azar a uno de tres tratamientos, el diseño resultante utiliza n = 2 réplicas por combina- 
ción de bloque por tratamiento y un total de N = 30 observaciones. La figura 8.2 muestra la interacción 
entre tratamientos y bloques. Obsérvese en particular las diferencias entre medias de tratamiento y la 
existencia de cierto paralelismo de los perfiles de tratamiento para cada nivel de la variable de bloqueo, 
lo que permite sospechar que probablemente el efecto de interacción no será significativo. 
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SALIDA 8.2 
Análisis descriptivo de los datos del ejemplo 8.1 


Variable dependiente: tmin 
Tratamientos (4) Bloques (B) | Media 
al bl 6.0000 
b2 6.5000 
b3 6.0000 
b4 5.5000 
b5 7.5000 
6.3000 
b1 7.0000 
b2 7.5000 
b3 9.0000 
b4 11.0000 
b5 10.0000 
8.9000 
bl 8.0000 
b2 9.0000 
b3 9.0000 
10.5000 
11.0000 
9.5000 


10- 


tmin.mean 


Figura 8.2. — Gráfico de perfil de la interacción de tratamientos por bloques. 
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El análisis estadístico del DBA:3x5,n= 2 requiere precisar la naturaleza de los modelos implicados. 
Suponiendo efectos fijos para el factor de tratamiento y aleatorios para el factor de clasificación (ya que 
pretende representar a toda la población), el modelo interactivo es Y; ¡zx = 4+4¡+b+(0b) jp +e¡;x, don- 
de a ; representa efectos fijos, bz y (ab) ¡z son efectos aleatorios y e;;y es una variable aleatoria distribui- 
da según e; jk NID(O, a). Sin embargo, este modelo no cumple con el supuesto de no interacción entre 
bloques y tratamientos y por tanto no es un modelo válido a menos que por alguna razón sustantiva al 
investigador le interesara específicamente interpretar el efecto interactivo entre bloques y tratamientos. 
Para comprobar si se cumple o no el supuesto de aditividad, se prueba primero el modelo interactivo y 
se determina la significación de la interacción tratamientos por bloques. Si la interacción no resulta sig- 
nificativa, el supuesto se asume y por tanto puede ajustarse finalmente el modelo aditivo e interpretar 
sus efectos. En cambio, si la interacción resultara significativa, el modelo aditivo no puede ser suscepti- 
ble de prueba y el análisis se concentrará en la descripción de los efectos simples. El mismo proceso de 
prueba puede obtenerse también mediante el ajuste condicional de modelos. El ajuste del modelo inter- 
activo apunta que la interacción no resultó estadísticamente significativa: F(8, 15) = 1.206; P = .359. En 
consecuencia, se selecciona el modelo aditivo: Y; ¡ = 4+ ¡+ bx + €;¡x, donde el nuevo término residual 
es la suma del término residual del modelo no aditivo más el término de interacción A x B. 

Los cálculos implicados para obtener los modelos interactivo y aditivo son similares a los de un 
ANOVA factorial (véase cuadro 3.11). La salida 8.2 resume el ajuste del modelo aditivo, que obtuvo dife- 
rencias significativas entre los tres tipos de recompensa: F4(2,23) = 18.002; P < .001,f)p =.610. 


SALIDA 8.2 
Análisis de varianza del modelo aditivo del ejemplo 8.1 


Variable dependiente: tmin 


Fuentes SC 
Modelo 82.400 
A (tratamientos) 57.867 


B (bloques) 24.533 
Residual 36.967 
Total 119.367 


Obsérvese que la salida 8.2 también muestra diferencias significativas entre niveles de inteligencia, 
Fp(4,23) = 3.816;P = .016,)p = .399, pero este resultado es secundario y no suele incluirse en un in- 
forme de investigación. Se asume que habrá diferencias significativas entre bloques y, por tanto, que la 
variable de bloqueo explicará una parte significativa de la varianza de la variable de respuesta, porque 
de no ser así el DBA no habría cumplido el objetivo perseguido de reducir la varianza de error debida 
a heterogeneidad de las observaciones. En ciertas ocasiones, sin embargo, el factor de bloqueo puede 
ser también un objetivo primario del diseño, en cuyo caso las diferencias entre bloques tienen un inte- 
rés intrínseco para el investigador, además de contribuir a reducir la varianza de error residual. En tales 
casos, el factor de bloqueo suele ser fijo. 

Extrema precaución debe concederse a la interpretación de las medidas de magnitud del efecto de 
la salida 8.2, obtenida con el programa SPSS. Se utiliza mon y por tanto no es posible interpretar la mag- 
nitud en términos de proporción de varianza total explicada, ya que la suma de los índices para A y para 
B (sin contar el componente residual) es 7 = 0.610 + 0.399 = 1.009. Aunque SPSS ofrece por defecto 


el índice 1 como estimación de la magnitud del efecto del tratamiento, como muestra la salida 8.2, en 
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este texto recomendamos el uso de w? (efectos fijos) y p (efectos aleatorios), o bien estimando los com- 
ponentes de la varianza por el método de los momentos o bien a partir de las razones F. Por el primer 
procedimiento, siendo Ía = 1.822, 0% = 0.754, es = 1.607 y os = 4.183, el efecto de A explicaría casi un 
44% de la varianza (0% = 1.822/4.183 = 0.436) y el efecto de B un 18% (6? = 0.754/4.183 = 0.180). Del 
mismo modo, si sólo se dispone de las razones F (o sea, si sólo se puede acceder al informe de investi- 
gación), el efecto de tratamientos y de bloques se obtendría aplicando: 


l Fa-1 
(gla) x (Fa-1) 0.436 p= 


bx(Fg-1) 
Ñ 0.180 
(gl (Fa= 1D + (0)(Fg - 1)]+ N 


0% = = 
(gla(Fa=D + (0D (FB=DJ+4N === 


Y puesto que hay tres tratamientos, tiene también interés averiguar cuál de los tratamientos es res- 
ponsable del efecto. Las comparaciones entre medias de tratamiento mediante la prueba DHS de Tu- 
Key se presentan en la salida 8.3 y las pruebas de rango mediante subconjuntos homogéneos en la salida 
8.4. Resulta obvio que la recompensa económica (al) es el nivel de tratamiento más conveniente, ya que 
presenta diferencias significativas en el tiempo en minutos requerido para realizar la tarea compleja con 
respecto a la recompensa verbal (al > a2), con P<.001, y a la carencia de recompensa (al > a3), con 
P < .001, pero sin embargo no hay diferencias significativas entre la recompensa verbal y la no recom- 
pensa (al = a3), con P =.549. 

La conclusión más importante de este estudio es que hay diferencias estadísticamente significativas 
entre los tratamientos con recompensa utilizados, siendo el nivel de tratamiento que se resolvió más 
pronto el de recompensa económica (Media al = 6.300) y el que más tiempo tardó el que no ofrecía 
ninguna recompensa (Media a3 = 9.500). Además, la potencia observada de la prueba F, es óptima, 
con A 4 = (2)(18.002) = 36.004 y $, = 0.999, lo que apunta que el número de réplicas es suficiente. 


SALIDA 8.3 
Comparaciones entre medias de tratamiento con la prueba DHS de Tukey 


Variable dependiente: tmin 


Prueba DHS de Tukey Diferencia de Límites IC 95% 


(D) tratamientos  (J) tratamientos medias (I-J) Inferior | Superior 
al al -2.600 Ñ -4.020 -1.180 
a3 -3.200 z -4.620 -1.780 


al al 2.600 a 1.180 4.020 
a3 -0.600 y -2.020 0.820 
a3 al 3.200 . 1.780 4.620 
al 0.600 y -0.820 2.020 


SALIDA 8.4 
Pruebas de rango entre medias con la prueba DHS de Tukey 


Subconjuntos 


Tratamientos 1 
al 6.300 
a2 

a3 
Probabilidad 
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En resumen, el DBA replicado puede ser un diseño más conveniente que el DCA para detectar efec- 
tos de tratamiento debido a la reducción que se produce sobre la varianza de error como consecuencia 
de introducir una variable de bloqueo. Para valorar de forma aproximada la mejora que significa el DBA 
respecto del DC A, se puede recomponer la salida 8.2 del DBA para convertirla en un DCA equivalente, 
o sea, con las mismas unidades experimentales, sumando al componente de error el efecto de la varia- 
ble de bloqueo. La SC Residual resultante sería SCr = 36.967 + 24.533 = 61.500, con gg = 4+23=27 y 
MC = 61.5/27 = 2.278. Obsérvese, respecto de la salida 8.2, la importante reducción que se consigue en 
la estimación de la varianza de error al pasar de MCp = 2.278 en el DCA a MCr = 1.607 en el DBA, una 
reducción aproximada del 29%, aunque con una pérdida de 4 grados de libertad. Una forma más apro- 
piada para determinar si el DBA es más conveniente que el DCA es calcular la EFICIENCIA RELATIVA 
mediante la razón entre las medias cuadráticas residuales de ambos diseños: 


_ MCr(DCA) 


 _—__— (8.1) 
MCR(DBA) 


donde ER = 2.278/1.607 = 1.42. En consecuencia, en igualdad de condiciones, el DBA representa una 
ganancia en eficiencia de un 42% respecto del DC A equivalente. 


8.3.2. DBAnoreplicado 


Un caso especial del DBA que tratamos en este capítulo se presenta cuando hay una sola réplica por 
combinación de bloques por tratamientos. El ejemplo 8.2 ilustra esta situación utilizando únicamente 
la primera réplica de los datos empíricos del ejemplo 8.1. Recuerde que se ensayaron tres tipos de mo- 
tivación para la solución de una tarea cognitiva compleja (variable de tratamiento A, con niveles al: 
económica, a2: verbal y a3: sin recompensa) en cinco grupos de estudiantes universitarios que diferían 
entre sí por el nivel de inteligencia obtenido en un test al uso (variable B, con niveles b1: alto, hasta b5: 
bajo). Como variable de respuesta se utilizó el tiempo en minutos requerido para completar la tarea. Los 
datos empíricos del ejemplo 8.2 se presentan ahora en el cuadro 8.6. 


CUADRO 8.7 
Datos empíricos del ejemplo 8.2 


Bloques (B) 
Tratamientos (4) | bl (alto) | b2 b5 (bajo) 


al 7 8 
al 10 
a3 12 


El correspondiente análisis descriptivo se presenta en la salida 8.5. Nótese que se representan pun- 
tos, en lugar de las correspondientes varianzas, para cada una de las combinaciones de tratamientos 
por bloques, porque para cada combinación se ha empleado sólo una unidad experimental, lo que su- 
pone una reducción a la mitad de los grados de libertad del ejemplo 8.1, pasando de 30 a 15 grados de 
libertad. El número de combinaciones de tratamientos pot bloques es 3 x 5= 15, y por tanto sólo existe 
una réplica. En consecuencia, la notación para este diseño es DBA:3x5,n=1. 
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SALIDA 8.5 
Análisis descriptivo de los datos del ejemplo 8.2 
Variable dependiente: tmin 

Tratamientos (4) Bloques (B) | Media 
al b1 5.0000 
b2 7.0000 
b3 7.0000 
b4 6.0000 
b5 8.0000 
6.6000 
b1 8.0000 
b2 8.5000 
b3 10.0000 
b4 12.0000 
b5 10.0000 
9.0000 
b1 8.0000 
b2 10.0000 
b3 10.0000 
b4 12.0000 
b5 12.0000 
10.4000 


Si E) 


Supongamos ahora que tanto el factor de bloqueo como el factor de tratamiento representan efectos 
fijos, aunque los niveles del factor de bloqueo acotan toda la población de niveles de inteligencia. En tal 
caso, el modelo matemático requerido para el modelo de efectos fijos es: 


Vik = + 05+ Pr + jr (8.2) 


que es un modelo esencialmente aditivo porque la interacción entre tratamientos y bloques se confun- 
de con el término de error. Nótese además que se suprime el subíndice ¿ porque no existe más que una 
réplica por combinación de bloques por tratamientos. La descomposición de la varianza total aisla un 
componente para el factor de tratamiento, (SC4) , otro componente para el factor de bloqueo (SCg) y 
un componente residual (SCr), que es en realidad la suma de dos componentes indisociables, el com- 
ponente de error puro más el componente de interacción (SC4g), que se encuentran en situación de 
confundido. En este tipo de escenario no es posible calcular un componente para la interacción, y por 
tanto es preciso definir un modelo aditivo. 

Los cálculos requeridos para esta forma de análisis de varianza utilizando las fórmulas simplificadas 
del capítulo 3 se resumen en el cuadro 8.8 y presenta algunas peculiaridades que es preciso resaltar. Ob- 
sérvese que sólo se requieren cuatro cantidades básicas, puesto que la cantidad básica [R] no se puede 
obtener porque no hay varianza de error para cada combinación de tratamientos por bloques. Es preci- 
so por ello recurrir a la cantidad básica [4B], que es simplemente la suma cuadrática de las unidades de 
cada combinación de tratamientos por bloques, para completar las cantidades básicas necesarias. Co- 
mo consecuencia, la SC subsume la interacción AB y el error puro, aunque la expresión para obtener 
los grados de libertad es de hecho la expresión para la interacción A x B. 
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CUADRO 8.8 
Descomposición de la variación del ANOVA para el DBA no replicado 


Cantidades básicas Procedimiento de cálculo No términos 
11] =7?/ab 1332/15 =1179.267 | 1 
[A] =E A5/b 332/15+482/15+522/15=1219.400 | 3 
[B] =EBi/a 212/3+...+30%/3=1198.333 | 5 
[AB] = EL ABS, 524+72+...+122+122=1247 | 15 

Sumas de cuadrados Procedimiento de cálculo G. libertad 
SCA=[4]-[1] 1219.400-1179.267=40.133 | gl¿=2 
SC =[B]-[1] 1198.333 - 1179.267 =19.067 | glg=4 
SCr =[4B]-[4]-[B]+[1] | 1247-1219.4-1198.333+1179.267=8.533 | gl¿g=8 
SCy =[4]+[B]-2[1] 1219 +1198.333 — (2)(1179.267) = 59.200 | gly=6 
SC7 = SCm+SCr 59.200+8.533 = 67.733 | gly=14 


El correspondiente análisis de varianza para el modelo aditivo se muestra en la salida 8.6 y demues- 
tra que existen diferencias significativas entre tratamientos: F4 = 18.812; P =.001; 0% = 0.825. 


SALIDA 8.6 
Análisis de varianza del modelo aditivo (ejemplo 8.2) 
Variable dependiente: tmin 
Fuentes 
Modelo 
A (tratamientos) 
B (bloques) 


Residual 


Total 


La salida 8.6 se obtuvo con SPSS e incluye como índice de magnitud del efecto UA para cada com- 
ponente, que debe interpretarse con extrema precaución, puesto que la suma no es una proporción de 
varianza explicada, como puede observarse. Una forma menos sesgada de magnitud del efecto puede 
obtenerse si sólo se dispone de las F por el procedimiento usual (utilizando grados de libertad para los 
efectos fijos de A y de B). En consecuencia, para el factor de tratamiento, 

0 A [2 47.813)] = 0.552 
[4)07.813) + (4) (3.469) + 15] 
También se puede estimar WA desarrollando los componentes de varianza: $ a =12)(Q20.067-1.067)]/15 = 
2.533, 5 = [(4) (4.767 — 1.067)]/15 = 0.987 y 6? = 1.067, cuya suma es o = 4.507, y la magnitud del efec- 
to para A es 0 = 2.533/4.587 = 0.552. La potencia observada de la prueba del efecto de tratamiento es 
también aceptable, ya que con A= (2)(8.813) = 37.625 y al nivel de confianza del 95%, P4 = .996. 

Nótese que el efecto de la variable de bloqueo carece de interés, aunque obtiene también una razón 
F significativa, porque se incluye con el único objeto de reducir la varianza de error. En algunas ocasio- 
nes, sin embargo, el efecto de la variable de bloqueo puede tener interés intrínseco para el investigador 
y ser por tanto objeto de interpretación. 
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El diseño DBA no replicado asume que no existe interacción entre bloques y tratamientos. Para 
comprobar si se satisface el supuesto de no interacción entre bloques y tratamientos con una réplica 
por casilla se utiliza PRUEBA DE ADITIVIDAD de Tukey (1949, 1955), que se recomienda aplicar incluso 
cuando no existan diferencias significativas entre tratamientos. La prueba implica calcular una suma de 
cuadrados correspondiente al componente interactivo, denominada SC DE NO ADITIVIDAD (SCya): 


2 
TD] [Eb 2 Ya 
EY VEL 071 Ei 


SCwa= (8.3) 


Esta prueba utiliza un grado de libertad del término Residual para encontrar el patrón de interacción 
que los datos presentan, descomponiendo la SCz en dos porciones ortogonales y aplicando una ra- 
zón F con sus respectivas medias cuadráticas. La prueba de aditividad es una prueba indirecta. Rojas 
(1973) demostró que es equivalente a la prueba de un coeficiente de regresión en un modelo con una 
covariante. El cuadro 8.9 resume los cálculos requeridos, a partir de los datos empíricos y las medias de 
tratamiento de la salida 8.6. Se destacan en cursiva los promedios de tratamiento, bloque y media global 
y subrayadas las sumas de la fila y las dos columnas implicadas en el cálculo, 2 ¡4 ;, Xx ByE ¡YirGj. 


CUADRO 8.9 
Esquema de cálculo del componente de no aditividad 


Medias EjYirGj BE Y ¡gp Gj) 
7.0000 . 6.7993 -12.6923 
8.3333 a 5.3325 2.8438 

10 9.0000 » 6.7991 0.9063 

12 10.0000 c 13.5990 15.4117 


10 10.0000 7.5990 8.6119 
Medias 9.6000  10.4000 | 8.8667 6.3556 9.3939 
a; 0.7333 1.5333 0 

a? 0.5378 2.3511 | 8.0267 


La suma de cuadrados para el componente de no aditividad (SCy a) se obtiene aplicando la ecuación 
8.3 a las cantidades subrayadas en el cuadro 8.9. El resultado es: 


(9.3939)? 
1.730 


e PEA aos ES Y 
NA” (6.3556)(8.0267) ——— 


La salida 8.7 es un ajuste condicional de modelos que resume el análisis de varianza global que se 
presentó en la salida 8.6 asumiendo un modelo aditivo, donde se ha dividido el componente de error 
residual de la salida 8.6, con (a— 1)(b— 1) = 8 grados de libertad, en dos componentes: No aditividad, 
con 1 grado de libertad y Residual, al que le corresponden los 7 grados de libertad restantes. El ajuste 
condicional de modelos compara la SCr y los grados de libertad de un modelo restringido (el modelo 
aditivo, o modelo 1) con la de un modelo aumentado (el modelo no aditivo o modelo 2) para decidir cuál 
de los dos es el modelo óptimo. La diferencia entre ambos modelos no estadísticamente significativa, 
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por lo que el investigador debe decidirse por el modelo más simple (el modelo 1) y concluir que el com- 
ponente de no aditividad del modelo 2 es irrelevante. La conclusión es que se ajusta el modelo aditivo, 
satisfaciendo el requisito básico que deben cumplir los DBA de no interacción entre la estructura de 
tratamientos y la estructura de control. 


SALIDA 8.7 
Ajuste condicional de modelos para probar el componente de no aditividad 


Modelo 1: tmin= A+ B 
Modelo 2: tmin= A+ B+ Ax B 


Obsérvese que la razón F para someter a prueba la hipótesis (nula) de aditividad es Fap(1,7) = 
1.791; P = .224, lo que permite al investigador concluir que el modelo aditivo es el modelo óptimo. Todo 
el peso interpretativo debe descansar entonces sobre el factor de tratamiento, para el que se demuestra 
(véase salida 8.8) que existen diferencias estadísticamente significativas: F1(2,8) = 18.812;P =.001. 

El programa SPSS permite también calcular el componente no aditivo de la prueba de aditividad 
de Tukey. Para ello es preciso usar la representación multivariante de los datos (cuadro 8.9) y después el 
módulo 'Reliability' con la opción Prueba de aditividad de Tukey. El mismo resultado se obtiene compu- 
tando los valores pronosticados mediante el módulo 'Mixed', elevarlos al cuadrado e incorporarlos co- 
mo una covariante en el análisis (véase sintaxis en la página web del texto). Si la prueba de aditividad 
resulta significativa (y por tanto es necesario contemplar la interacción entre bloques y tratamientos), 
el programa 'Reliability' incorpora también en la salida el valor de potencia a la que habría que elevar 
las observaciones originales de la variable de respuesta para conseguir nuevas puntuaciones con la pro- 
piedad de aditividad. Para los datos empíricos del ejemplo 8.2, si no se ajustara un modelo aditivo, las 
puntuaciones de la variable de respuesta transformada (Yi; = q) producirían un modelo aditivo. 


SALIDA 8.8 
Tabla ANOVA con la prueba de aditividad de Tukey 


Variable dependiente: tmin 
Fuente SC tipo III MC 
Modelo 8361.444 440.076 
Tratamientos (4) 40.133 20.067 
Bloques (B) 19.067 4.767 


Residual 8.533 1.067 
No aditividad (NA) 1.730 1.730 
Diferencia 6.803 .972 

Total 67.733 4.838 


4 Potencia de la transformación para conseguir aditividad = —0.633 


El ajuste del modelo de la salida 8.8 es aceptable, ya que Fm(19,8) = 54.9;P < .001 y el factor de 
tratamiento es estadísticamente significativo, F4(2.8) = 18.812;P = .001. El factor de bloqueo tiene un 
interés secundario, principalmente como argumento en favor de la efectividad del control experimental. 
La magnitud del efecto que explica es mayor del 21 % (0% =.215). 
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Las comparaciones múltiples entre medias de grupo mediante pruebas de rango con DHS de Schef- 
fé al nivel de significación del 5% se representan en la salida 8.9 y muestran diferencias significativas 
entre los tratamientos al y a2 y entre al y a3, pero no entre a2 y a3, y por tanto la media obtenida con 
recompensa económica (al) difiere significativamente de los restantes medias. En el ejemplo 8.2, con 
una réplica por combinación de tratamientos por bloques, se repite el mismo patrón que se observó en 
el ejemplo 8.1 con dos réplicas por combinación de tratamientos por bloques. 


SALIDA 8.9 
Comparaciones entre medias de tratamiento con la prueba DHS de Tukey 


Subconjuntos 


Tratamientos 1 
al 6.000 
a2 

a3 
Probabilidad 


8.4. DBAy DVC: DOS ALTERNATIVAS DE DISEÑO 


8.4.1. Introducción 


La utilización de una variable de clasificación para realizar un bloqueo de las unidades experimen- 
tales con el objeto de reducir su heterogeneidad natural constituye un ejemplo típico de CONTROL EXPE- 
RIMENTAL. El diseño más relevante de esta forma de control es el DBA, que asume que la/s variable/s de 
clasificación o variable/s de bloqueo tiene/n naturaleza categórica, y se analiza mediante ANOVA. Pe- 
ro en ocasiones la misma variable no tiene naturaleza categórica, sino numérica (continua o discreta). 
Una alternativa analítica en tal caso consiste en utilizar directamente la variable numérica como una 
variable concomitante. El resultado es el DISEÑO CON VARIABLES CONCOMITANTES (DVC), un diseño que 
se analiza mediante ANCOVA y es un ejemplo típico de CONTROL ESTADÍSTICO. Control experimental 
y control estadístico persiguen el mismo objetivo pero utilizan procedimientos distintos para lograrlo 
(véase capítulo 6, sección 6.2.2). Ambos diseños, DBA y DVC, constituyen dos alternativas para analizar 
datos empíricos en presencia de heterogeneidad de las unidades experimentales. En tal caso, se plantea 
la cuestión: ¿cuál de las dos alternativas es más apropiada? 

Diversos estudios (p. ej., Feldt, 1958; Cox, 1957; Huitema, 2011; Maxwell y Delaney, 2004) han argu- 
mentado que el DVC con una variable concomitante es en general más potente que el DBA con una 
variable de bloqueo cuando la correlación entre la variable de bloqueo o covariante y variable de res- 
puesta se encuentra comprendida dentro del rango 0.60 — 0.80, pero cuando la correlación es inferior a 
0.60 resulta más recomendable el DBA que el DVC. En ambos casos suponemos que la relación entre 
variable concomitante y variable de respuesta es de naturaleza lineal en la población. 

En cualquier caso, el DVC resulta ser uno de los diseños más versátiles porque es la forma típica 
que adopta cualquier diseño básico (p. ej., DCA, DJE, DBA, DCL y DMR) cuando incluyen una o más 
covariantes. Así, si la transición de un DCA a un DBA consiste en incluir una variable de bloqueo, la 
transición de cualquiera de los diseños que tratamos aquí a un DVC consiste simplemente en incluir 
una o más covariante/s. El objetivo esencial del DVC es también la reducción del error residual median- 
te el control estadístico de una o más variables concomitantes o covariantes. 
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8.4.2. Una comparativa entre el DBA y el DVC 


Tlustramos la comparación entre las dos alternativas con los datos del ejemplo 5.1, del capítulo sobre 
ANCOVA. Se trataba de probar tres métodos de entrenamiento (factor A) para mejorar el rendimiento 
en matemáticas en niños de Primaria, y se tomaron de los registros del centro escolar las puntuaciones 
en autoestima para cada sujeto participante (covariante X), que suponemos representa una fuente de 
variabilidad que afecta sustancialmente a las respuestas dadas por las unidades experimentales a los 
métodos de entrenamiento. Para ello hemos categorizado! la covariante numérica autoestima al objeto 
de obtener un factor (B) con tres niveles, siguiendo el criterio siguiente: nivel b1: de 3 a 7 puntos; nivel 
b2: de 8 a 10 y nivel b3: de 11 a 17. Los datos empíricos del ejemplo 8.3 se presentan en el cuadro 8.10. 
La salida 8.10 presenta el análisis descriptivo. 


CUADRO 8.10 
Datos empíricos del ejemplo 8.3 


El diseño resultante asume efectos fijos y es no equilibrado.Las fórmulas de cálculo simplificado del 
capítulo 5 no son apropiadas con diseños no equilibrados. 


SALIDA 8.10 

Análisis descriptivo de los datos del ejemplo 8.3 
Variable dependiente: Y 
Media 
10.0000 
15.0000 
16.0000 
14.0000 

7.6667 
12.0000 
16.3333 
12.0000 
15.0000 
16.6667 
23.0000 
18.0000 


ZI[Nd VO NiI|O = GOiujo » |3 


lDiversos estudios han demostrado que no es recomendable categorizar variables numéricas en dos o más categorías (p.e., 
Royston, Altman y Sauerbrei, 2006), y nos adherimos a esta recomendación. En este ejemplo lo usamos con propósitos didácticos. 
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Por su parte, la figura 8.3 muestra un gráfico de la interacción Ax B donde se observa un notable 
paralelismo de las medias de tratamiento para los diferentes niveles de la variable de bloqueo. 


20- 


B2 
o 1 
sáb 2 
E 


Y.mean 


Figura 8.3. — Perfiles de las medias de tratamiento (4) para los diferentes niveles de B. 


El análisis de varianza para el modelo no aditivo y no equilibrado del DBA:3x3,N=21 resultante 
se muestra en la salida 8.11 utilizando SC tipo III. Obsérvese que el componente de interacción no 
es estadísticamente significativo F¿g(4, 12) = 0.203; P = .932, y por lo tanto descartamos el modelo no 
aditivo como modelo apropiado para representar los datos empíricos. 


SALIDA 8.11 
Análisis de varianza del modelo interactivo del DBA 


Variable dependiente: Y 

Fuentes SC MC 
Modelo 409.500 8 15.188 
143.085 2 71.542 


258.192 2 | 120.096 
3.591 4 0.898 
53.167 4.431 
462.667 


La tabla de análisis de varianza para el modelo aditivo del DBA se expone en la salida 8.12. A con- 
tinuación hemos representado los resultados del submodelo ANCOVA para el DVC (salida 8.13, véase 
también salida 5.6b). Téngase en cuenta que a efectos comparativos A del DBA se corresponde con 
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A(método) del DVC y B es una variable de bloqueo en la que se ha categorizado la variable numéri- 
ca X (auto), que es una covariante en la salida 8.13. Los resultados de ambas salidas son, como puede 
comprobarse, bastante similares. Ante todo se constata, además del efecto significativo de la variable de 
bloqueo o de la variable concomitante (con un grado de libertad, por tratarse de una variable numérica), 
que el efecto del factor de tratamiento es estadísticamente significativo en ambos casos. En consecuen- 
cia, cualquiera de las dos estrategias que comentamos en esta sección es superior en sensibilidad a un 
DCA donde no se utiliza explícitamente el control experimental o estadístico (aunque sí el control por 
aleatorización). 


SALIDA 8.12 
Análisis de varianza del modelo aditivo del DBA (ejemplo 8.3) 


Variable dependiente: Y 

Fuentes SC MC 

Modelo 405.909 4 | 101.477 
A 167.117 2 83.558 


B 275.242 2 137.621 
Residual 56.758 3.547 
Total 462.667 


SALIDA 8.13 
Análisis de covarianza para el DVC (ejemplos 8.3 y 5.1) 


Variable dependiente: Y 
Fuentes SC MC F 
Modelo 416.680 138.893 51.346 
A (método) | 178.959 2 89.480 33.079 


X (auto) 286.014 286.014 105.732 
Residual 45.986 2.705 
Total 462.667 


Por otra parte, conviene precisar los siguientes aspectos diferenciales de las salidas 8.12 y 8.13 al 
objeto de analizar con mayor detalle la naturaleza de los dos diseños que se comparan aquí: 


— En primer lugar, hay una ligera ventaja del diseño DVC respecto del DBA, ya que la porción de 
varianza que explica la variable de bloqueo en el DBA (SCg = 275.242) es algo menor que la ex- 
plicada por la covariante en el DVC (SCx = 286.014), pero además se reparte entre los dos grados 
de libertad que le corresponden por tratarse de un factor con tres niveles. A la covariante, por el 
contrario, le corresponde un grado de libertad puesto que es una variable numérica. 


— En segundo lugar, la porción explicada por el ANOVA para el factor A en el DBA (SCA(DBA) = 
167.117) es menor a la explicada por el mismo factor en el ANCOVA para el DVC (SCA(DVC) = 
178.959), obviamente con los mismos grados de libertad, puesto que en ambos casos se trata de 
un factor de tratamiento con dos niveles. 


— Y finalmente, el resto de la variación del DBA constituye variación residual (SCR(DBA) = 56.758) y 
representa también una porción no explicada algo más alta que la del DVC (SCr(DVC) = 45.986), 
y además con la adición de un grado de libertad. 
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En general, cuando se categoriza una variable numérica (variable concomitante o covariante) con- 
virtiéndola en un factor de bloqueo con 3 (o más) niveles, se produce una pérdida moderada de sen- 
sibilidad para probar el efecto del tratamiento. Por esta razón no resulta una estrategia recomendable, 
si se tiene una variable numérica, convertirla en una variable categórica. La superioridad del DVC con 
una covariante sobre el DBA con una variable de bloqueo es manifiesta, por lo que una recomendación 
general es su utilización en menoscabo del DB A, como proponen algunos autores (p. ej., Maxwell y De- 
laney, 2004, p. 452). Sin embargo, hay tres situaciones particulares donde el DBA podría estar justificado. 
En primer lugar, cuando la relación entre la covariante y la variable de respuesta no es estrictamente li- 
neal. El ANCOVA asume una relación lineal, por lo que no hay otra alternativa que utilizar una variable 
de bloqueo. En segundo lugar, cuando la correlación lineal entre covariante y variable de respuesta no 
sea superior a r = 0.60, como demostraron los estudios de Feldt (1958). En el ejemplo 8.3, la correlación 
entre la covariante y la variable de respuesta fue sin embargo de ry x = 0.708. Y en tercer lugar, cuando 
por la naturaleza de la temática de investigación se requiera aplicar un bloqueo complejo basado en 
perfiles particulares de cada unidad experimental, en cuyo caso la covariante carece de interés. 


8.5. DISEÑO DE CUADRADO LATINO 


8.5.1. Introducción 


Hasta ahora se ha considerado sólo una única variable de bloqueo, pero puede haber más de una, 
siempre y cuando cada una de ellas logre el propósito fundamental que justifica su utilización: la re- 
ducción de la varianza residual o de error debida a heterogeneidad de las unidades experimentales. Sin 
embargo, la introducción de una segunda variable de bloqueo puede suponer un notable incremento 
en el número de unidades experimentales. Por ejemplo, en un DBA no replicado con una variable de 
bloqueo con 4 niveles y un factor con 4 tratamientos se requiere un total de 4 x 4= 16 unidades experi- 
mentales y en un DBA replicado similar con 2 réplicas supondría 32. La introducción de una segunda 
variable de bloqueo también con 4 niveles en un DBA no replicado requeriría un total de 4x 4 x 4= 64 
unidades experimentales, y en un DBA replicado con dos réplicas supondría un total de 128. 

El ejemplo citado corresponde a un DISEÑO DE BLOQUES ALEATORIOS COMPLETO. Sin embargo, no es 
necesario que existan todas las unidades experimentales que se requieren. En un diseño no replicado 
con 4 bloques y 4 tratamientos lo imprescindible es que existan al menos 4 unidades experimentales por 
cada nivel de la variable de bloqueo, para distribuirlas al azar entre los tratamientos. Es también posible 
tener 8 (2 réplicas por bloque) o 12 unidades experimentales (3 réplicas por bloque) para distribuirlas 
entre los tratamientos. Pero si hay menos de 4 unidades experimentales se trataría de un DISEÑO DE 
BLOQUES ALEATORIOS INCOMPLETO, un diseño con nuevos problemas analíticos que no trataremos aquí. 

El caso particular en el que hay dos variables de bloqueo y para cada combinación de las dos va- 
riables de bloqueo se registra una unidad experimental que se asigna al azar a un nivel de tratamiento 
constituye el DISEÑO DE CUADRADO LATINO (DCL). Cuando una de las variables de bloqueo la cons- 
tituyen las mismas unidades experimentales que reciben todos los tratamientos el diseño resultante 
se llama DISEÑO DE CUADRADO LATINO INTRASUJETO, que se caracteriza por emplear contraequilibra- 
ción intrasujeto (véase sección 6.2.2), pero que tampoco trataremos en este texto. En cualquier caso, la 
peculiaridad del DCL se debe a la forma típica que suele presentar, donde el factor de tratamiento se 
distribuye dentro de la estructura cuadrada que forman las dos variables de bloqueo. Empleando a; 
para representar los niveles del factor de tratamiento (4), y bj y c¡ para representar los niveles de las va- 
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riables de bloqueo (B y C), el cuadro 8.11 (izquierda) describe un ejemplo típico de cuadrado latino con 
dos variables de bloqueo y un factor de tratamiento. Se denomina CUADRADO LATINO ESTÁNDAR porque 
utiliza los cuatro tratamientos en secuencia en la primera fila y columna. 


CUADRO 8.11 
Ejemplos de cuadrado latino con cuatro niveles de tratamiento 
Variable de Variable de bloqueo (C) Variable de Variable de bloqueo (C) 
bloqueo (B) | cl | c2 | c3 c4 bloqueo (B) | cl | c2 | c3 c4 
bl al | a2 | as as bl al | a2 | as a3 


b2 a2|a3.| al al b2 a2 | a3 | al as 
b3 aa | as. al az b3 a3 | as | al al 
b4 a4 | al | al a3 b4 a4 | al | a3 az 


Observe que hay un total de a niveles de tratamiento (factor A, cuyos niveles se etiquetan con al 
hasta a4), b niveles de una primera variable de bloqueo (B, con niveles b1 a b4) y c niveles de una 
segunda variable de bloqueo (C, con niveles cl a c4), siendo a = b= c. Como consecuencia, la figura 
central es un cuadrado latino compuesto de un total de 4 x 4 casillas donde se distribuyen los 4 trata- 
mientos por filas y columnas conjuntamente. La notación que emplearemos aquí para simbolizar este 
diseño es DCL: d x d, siendo d la dimensión del cuadrado latino donde se insertan los a niveles del fac- 
tor de tratamiento. En el ejemplo ilustrativo del cuadro 8.11, se trata de un DCL:4x4,n= 1, y por tanto 
es un diseño no replicado. Otras disposiciones de los niveles de tratamiento además del cuadrado latino 
estándar son posibles intercambiando sus filas y/o columnas, pero un cuadrado latino debe necesaria- 
mente cumplir con dos condiciones: (1) todos los tratamientos deben estar representados en cada fila y 
columna del cuadrado, y (2) cada tratamiento debe preceder y seguir a cualquier otro el mismo número 
de veces. Observe que esta segunda condición no la cumple el cuadrado latino estándar del cuadro 8.11 
(izquierda). En cambio, si se utiliza para la primera fila la secuencia general (para un número determi- 
nado d de filas o columnas): 1,2,d,3,(d—1),4,(d —2),5 (para este ejemplo la secuencia sería 1,2, 4,3) y 
el resto de las filas en secuencia, el resultado es un cuadrado latino que cumple con las dos condiciones, 
como en el cuadro 8.11 (derecha). Esta secuencia no funciona cuando d es impar. 

El DCL puede también ser replicado o no replicado. El DCL no replicado requiere un total de d? uni- 
dades experimentales mientras que el DCL replicado utiliza algún múltiplo de d?. La principal ventaja 
del DCL es que persigue un objetivo similar al del DBA pero con una notable economía en el número 
de unidades experimentales requeridas. Pero, a pesar de su simplicidad, ha sido escasamente usado. 


8.5.2. DCLno replicado (ejemplo 8.4) 


Un experimento se planificó con la finalidad de evaluar la eficiencia de cuatro tratamientos psico- 
lógicos (factor A, con niveles al: psicoterapia, a2: tratamiento neuropsicológico, a3: tratamiento con- 
ductual y a4: placebo), en un grupo de pacientes clasificados en función de la gravedad de sus síntomas 
(factor B, desde b1: síntomas leves a b4: síntomas graves), y de la persistencia de los síntomas a lo largo 
del tiempo (factor C, desde cl: baja persistencia a c4: alta persistencia). Se seleccionaron un total de 
4? = 16 pacientes de cada una de las combinaciones de gravedad y persistencia y se asignaron al azar 
a cada nivel de tratamiento (al — a4). Los resultados obtenidos después de un periodo de dos semanas 
de tratamiento se evaluaron mediante un cuestionario en el que un experto registró la mejora de los 
síntomas en una escala de 18 puntos. Los datos del ejemplo 8.4 se representan en el cuadro 8.12. 
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CUADRO 8.12 
Datos empíricos del ejemplo 8.4 


persistencia (C) 


gravedad (B) | cl (baja) c2 c3 c4 (alta) 
b1 (leves) 4 (al) 5 (a2) 1 (a4) 3 (a3) 
b2 7 (a2) 5(a3) —6(al) 2 (a4) 
b3 6 (a3) 1(a4) | 9(a2) 7 (al) 
b4 (graves) 2 (as) 5(al) | 8(a3) 9(a2) 


El modelo matemático del DCL no replicado supone una combinación de una estructura de control 
con doble bloqueo y una estructura de tratamientos en un sentido. Utilizando los subíndices k y l para 
las dos variables de bloqueo (B y C) y ¡ para la variable de tratamiento (4), la ecuación del modelo, 
asumiendo efectos aleatorios para las variables de bloqueo y fijos para la variable de tratamiento, es 


Viki = + 05 +Dp+C]+€jk1 (8.4) 


donde y una constante que representa a la media global, y 


— yjK1 es el valor observado del tratamiento j para la combinación k, ! de las variables de bloqueo. 


— aq; es el efecto principal de la variable de tratamiento, que se supone constante y sometido a la 
restricción Y ¡aj=0. 


— bj es el efecto principal de la variable de bloqueo correspondiente a la fila, de carácter aleatorio. 


— c; es el efecto principal de la variable de bloqueo correspondiente a la columna, también de ca- 
rácter aleatorio. 


— €jx1 es el error residual que se asume distribuido según ejx - NID(, a?). 


El modelo de la ecuación 8.4 asume que no existe interacción entre la variable de tratamiento y las 
variables de bloqueo (es decir, se suponen nulas las interacciones AB, AC, BC y ABC) y por tanto se 
asume también un modelo aditivo. La prueba de aditividad de Tukey puede ser empleada con un DCL 
no replicado (como sucede con el DBA no replicado) para evaluar el cumplimiento de este supuesto 
(Kirk, 2013). El ejemplo 8.4 es por tanto un DCL : 4x4, n= 1. Observe que se representa como un factorial 
con dos factores, pero en realidad hay tres factores, dos factores de bloqueo para las combinaciones de 
las variables de bloqueo, y un factor de tratamiento combinado con los factores de bloqueo. Se trata de 
una disposición factorial 4x 4x4 del que tan sólo se toman 1/4 de las combinaciones existentes. 

El correspondiente análisis descriptivo se muestra en la salida 8.14. Nótese que con diseños no re- 
plicados no es posible calcular una medida de la varianza de cada combinación de tratamientos por 
bloques. Por esta razón la salida 8.14 prescinde de la columna de varianza. Además, puesto que cada 
tratamiento se observa una sola vez por fila y columna, no es necesario representar todas las combina- 
ciones de tratamientos por bloques. Se ha optado por una representación más simple que consiste en 
tablas descriptivas independientes combinando el factor de tratamiento para cada una de las variables 
de bloqueo implicadas. 
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SALIDA 8.14 
Análisis descriptivo de los datos del ejemplo 8.4 


Variable dependiente: mejora Variable dependiente: mejora 


= 


tratamientos síntomas 
al bl 

b2 

b3 

b4 


tratamientos persistencia 
al cl 

c2 

c3 

c4 


b1 
b2 
b3 


cl 
C2 
Cc3 
c4 


b4 


b1 
b2 
b3 
b4 


cl 
C2 
c3 
c4 


b1 
b2 
b3 
b4 


cl 
C2 
c3 
c4 


b1 
b2 
b3 
b4 
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NS HAS ES E A ES 
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La tabla ANOVA para el DCL: 4 x 4,n= 1 resume las fuentes de variación del modelo de la ecuación 
8.4 y se muestra en el cuadro 8.13. Puesto que se trata de un modelo aditivo, no tiene ninguna conse- 
cuencia para la prueba Fa que los tratamientos representen efectos fijos y los bloques efectos aleatorios, 
como sucede en este ejemplo. La razón que justifica la consideración de los factores de bloqueo como 
aleatorios es que el objetivo es generalizar los efectos de tratamiento a la población de niveles de grave- 
dad y la persistencia de sus síntomas, y no a niveles concretos de gravedad y persistencia. La decisión 
de definir los efectos como fijos o aleatorios tiene consecuencias para la magnitud del efecto. 


CUADRO 8.13 
Tabla ANOVA para un DCL no replicado 
Fuente SC tipo II gl MC E 
Modelo SCm =SCA+SCg+SCcC | 3(d-1) SCy/3(a-—1) Fm = MCm!/MCr 
Tratamientos (A) | SCA (d-1) SCaA!/(d-1) F¿= MCA/MCr 


Filas (B) SCg (d-1) SCgl(d-1) Fg = MCg/MCr 
Columnas (C) SCc (d-1) SCc/(d-1) Fc = MCc/MCr 
Residual SCr (d-D(d-2) | SCp/[(d-D(d-2)] 
Total SCy d?-1 
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Tras realizar los cálculos (véase cuadro 8.14), el ANOVA resultante (salida 8.15) prueba que existen 
diferencias estadísticamente significativas entre los tratamientos: F4(3, 6) = 50.667; P < .001. Aunque no 
suele ser objeto esencial de análisis, la tabla ANOVA muestra también que existen diferencias signifi- 
cativas entre los niveles de gravedad de los síntomas: Fg(3,6) = 12.333; P = .006 y entre los niveles de 
persistencia: Fc(3,6) = 5.667; P = .035, apuntando que se ha producido un control experimental efectivo 
de las dos variables extrañas. 


CUADRO 8.14 
Descomposición de la variación del ANOVA para el DCL no replicado 

Cantidades básicas Procedimiento de cálculo No términos 
11) = 72/42 (802/16==400 | 1 
[4] = Y 42/d 22? /4+...+(6)2/4=476 | 4 
[B)=5 B2/d (13)2/4+...+(24)?/4=418.5 | 4 
[C)=EC2/d a?/4+...+(22/4=408.5 | 4 
[ABC] = EX ABC y (1)? +(6)2...+(12+(2)2=506 | 16 

Sumas de cuadrados Procedimiento de cálculo G. libertad 
SCa =[4] - [1] 476-400=76 | gl4=3 
SCg =[B]-[1 418.5-400=18.5 | glg=3 
SCc =1C]-[1) 408.5-400=8.5 | glc=3 
SCr =[4BC]-[4]-[B]-[C]+2[1] | 506-476-418.5-—408.4+ (2)(400)=3 | glg=6 
SCm = [4] + [B] + [€] - 3[1] 476+418.5+408.5— (3)(400) =103 | glym=9 
SCr =[ABC]-[1] 506-400=106 | gly=15 


SALIDA 8.15 

Análisis de varianza del DCL no replicado 

Variable dependiente: mejora 

Fuentes SC 
Modelo 103.000 
tratamientos (A) 76.000 
síntomas (B) 18.500 
persistencia (C) 8.500 
Residual 3.000 
Total 106.000 


La figura 8.4 muestra los perfiles de las medias de tratamiento para cada uno de los niveles de la gra- 
vedad (B, izquierda) y persistencia (C, derecha) de los síntomas. El notable paralelismo de los perfiles 
(en particular para el factor B) nos permite una vez más sospechar que se cumplirá la condición de no 
interacción entre tratamientos y bloques. De hecho, la prueba de aditividad de Tukey obtuvo un com- 
ponente de no aditividad con SCy a = 0.075, y una razón F no significativa: Fy 1 = (0.075/1)/(2.925/5) = 
0.128; P =.735 (la sintaxis SPSS utilizada en el cálculo puede consultarse en la página web). 

La eficiencia relativa del DCL se evalúa respecto del DBA equivalente o bien para la variable de 
bloqueo de fila o la de columna. Así, para la variable de fila (síntomas) la MCr del DBA es MCR(DBA) = 
(8.5+3)/9 = 1.278 y la eficiencia relativa obtenida es la razón en la MC del DBA yla del DCL, osea, ER = 
1.278/0.5 = 2.55, lo que indica que el DCL tiene una ganancia en eficiencia de un 156% respecto al DBA 
para la variable de bloqueo de fila. Del mismo modo, para la variable de bloqueo de columna (persis- 
tencia), la MC del DBA sería MCr(DBA) = (18.5 + 3)/9 = 2.389 y la eficiencia relativa resultaría igual 
a ER = 2.389/0.5 = 4.78, apuntando que el DCL tiene un ganancia en eficiencia de un 378% respecto 
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del DBA para la variable de bloqueo de columna. Es decir, que en este último caso se necesitaría que el 


DBA tuviese 15 bloques para obtener la misma eficiencia que el DCL. 


Y.mean 
; 


Y.mean 
7 


Figura 8.4. — Medias de tratamiento en función de la gravedad (B) y persistencia (C) de los síntomas. 


Las comparaciones pareadas entre medias de grupo mediante la prueba de Bonferroni se muestran 
en la salida 8.16. Como observará, se encuentran diferencias estadísticamente significativas entre to- 
dos los niveles de tratamiento, con excepción de la diferencia entre tratamiento psicoterapeútico (al) y 


conductual (43) que no fue estadísticamente significativa. 


SALIDA 8.16 


Comparaciones múltiples con la prueba de Bonferroni 


Variable dependiente: tmin 
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8.5.3. Generalización del DCL 


El DCL:4x4,n= l tratado anteriormente es un diseño no replicado porque utiliza una única unidad 
experimental por combinación de tratamiento y bloques. Uno de los más importantes problemas de 
que adolece este diseño es el escaso número de grados de libertad que deja para el componente de error, 
particularmente cuando la dimensión del DCL es pequeña. Por ejemplo, con d = 3 los grados de libertad 
para el componente residual son g/g =2, y con d = 4 los grados de libertad residuales son g/p = 6 (véase 
salida 8.15). Pero en general, no se considera fiable una fuente de error residual con menos de 30 grados 
de libertad (Edwards, 1968; Arnau, 1984), por lo que la dimensión mínima del DCL para ser aceptable 
debería ser d > 7. En la investigación aplicada no es común trabajar con tantos niveles de tratamiento, 
por lo que alguna forma de generalización se hace necesaria para aplicar el DCL. Dos son las soluciones 
que se han propuesto para subsanar este problema, que tratamos a continuación. 


— En primer lugar, se puede incrementar el número de repeticiones del experimento utilizando no 
uno, sino dos o más cuadrados latinos, lo que implicaría también repetir dos o más veces el nú- 
mero de unidades experimentales. Tomando el cuadrado latino 4 x 4 como estándar, otras dispo- 
siciones de cuadrados latinos pueden encontrarse permutando sus filas (o columnas). El cuadro 
8.15 presenta a título de ejemplo dos repeticiones del cuadrado latino que se utilizó originalmente 
en el ejemplo 8.4. Obsérvese que la tabla central es una permuta de las columnas respecto de la 
tabla de la izquierda y la tabla de la derecha es una permuta de las filas respecto de la tabla central. 


CUADRO 8.15 
Tres disposiciones complementarias del cuadrado latino 
al a | as | a aa | a4 | a2 | al a2 | a3 | al ad 
a2 | a3 | al ad a4 | al | aBa | a2 aa | a4 | a2 | al 
aa | a4 | a2 | al al a2 | as | a a4 | al | aB | al 
a4 | al | aa | a2 a2 | a3 | al al al a2 | as | a 


El diseño de cuadrado latino con las tres disposiciones del cuadro 8.15 es un ejemplo de DCL 
REPETIDO, cuya notación sería DCL: 4x4, g = 3, donde g se refiere al número de repeticiones. Este 
diseño requiere un total de 4? x 3 = 48 unidades experimentales. Siendo los grados de libertad del 
componente residual (4— 1)(d—2), el diseño DCL dejaría un total de (d- 1)(d-2) g = (312)(3) = 18 
grados de libertad para el error residual (si A es aleatorio) o bien (d — 1)[g(d —1)-1] = 24 (si A 
es fijo). Se necesitarían más disposiciones de cuadrado latino para conseguir los 30 grados de 
libertad recomendados para el error residual. Así con g = 5, el diseño obtendría los grados de 
libertad recomendados, ya que (3)(2)(5) = 30, pero el número de unidades experimentales se eleva 
a (42)(5) = 80. Una opción más recomendable sería utilizar variables de tratamiento y bloqueo con 
dimensión d > 4. Téngase en cuenta que el DCL:5x 5 no replicado dejaría un total de (4) (3) (2) = 
24 grados de libertad residuales mientras que el DCL:5x5 con g =3 repeticiones dejaría un total 
de (4)(3) (3) = 36 grados de libertad residuales y requeriría (52) (3) = 75 unidades experimentales. 


Por lo demás, el desarrollo del DCL repetido tiene la estructura general del DCL no replicado, 
pero es necesario contemplar la presencia de un nuevo factor (la repetición del cuadrado latino, 
factor G) y ajustar consecuentemente el reparto de los grados de libertad. Para el ejemplo que 
tratamos, con a = 4 tratamientos, b= c = 4 filas/columnas y g = 3 repeticiones, la tabla ANOVA 
para el DCL:4 x 4, g =3 resultante adoptaría la forma del cuadro 8.16. El modelo matemático en 
el que se sustenta este diseño, asumiendo efectos fijos para tratamientos y repeticiones, es: 
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Y ¡kim =4+0¡+D +C/+0m + €jklm 


(8.5) 


donde 6 ,, es un nuevo parámetro que evalúa las diferencias entre medias de las diferentes repeti- 
ciones del cuadrado latino, con SCg = d? Pa (Y m - Y? y glc=(g-1). 


CUADRO 8.16 


Tabla ANOVA para un DCL:4 x 4 con g =3 repeticiones 


Fuente 


SC tipo HI 


gl 


Modelo 


Tratamientos (4) 


Filas (B) 


Columnas (C) 
Repeticiones (G) 
Residual 


SCA+SCB+SCC+SCG 
SCA 
SC 
SCc 
SCG 
SCr 


2gd+d-g-2=23 
(d-1)=3 

gl(d-1)=9 
gl(d-1)=9 

(g-1)=2 

(d- Dig(d-1)-1]=24 


Total 


SCT 


gd?-1=47 


— Una solución más simple, que evita el engorro de utilizar varios cuadrados latinos, consiste en 
utilizar más de una réplica para cada casilla del cuadrado latino. El diseño resultante es un DCL 
REPLICADO, cuya estructura difiere del DCL repetido y su modelo matemático es: 


Yi ji =4+ 07 + bh +C1+0¡+¡jk1 


(8.6) 


donde ó; es un término residual que se define como aquella porción de la variación explicada que 
no puede ser atribuida a la aditividad de los tres efectos principales y por esta razón denominada 
SC No Aditiva: SCya = SCy-— SCA + SCg + SCc, con glya = (d— 1)(d-—2). La notación para este 
diseño sería similar a las anteriores. Por ejemplo, para un factor con a= 4 niveles y n= 3 réplicas, 
la notación para el diseño sería DCL:4x4,n= 3. Asumiendo fijo el factor de tratamiento y aleato- 
rios los factores de bloqueo, con un modelo no restrictivo las E(MC) y la tabla ANOVA resultante 
adoptarían la forma mostrada en el cuadro 8.17. Observe que para el mismo caso que la opción del 
DCLrepetido, utilizando tres réplicas del DCL se sobrepasaría el número mínimo de 30 grados de 
libertad para el componente residual que se recomienda y requeriría sólo 4(4?)(3) = 48 unidades 
experimentales. Por esta razón es sin duda la opción más recomendable. 


Fuente 


CUADRO 8.17 


Tabla ANOVA para un DCL:4x4,n=3 


SC tipo II 


gl 


Modelo 
Tratamientos (4) 
Filas (B) 


Columnas (C) 
No aditividad (NA) 
Residual 


SCA+SCB+SCcC+ SCA 
SCA 

SC 

SCc 

SCA 

SCr 


d2-1=15 
(d-1)=3 
(d-1)=3 
(d— 
(d— 
d2(n—-1)=32 


D)=3 
D(d-2)=6 


Total 


SCT 


rd?-1=47 
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8.5.4. DCLreplicado con tres réplicas 


Ilustramos el DCL replicado con una ampliación a tres réplicas de los datos del ejemplo 8.4. Le 
llamaremos ahora ejemplo 8.5. Los datos se muestran en formato abreviado en el cuadro 8.18 con las 
tres réplicas separadas por comas dentro de sus respectivas casillas. El análisis descriptivo se muestra 


en la salida 8.17. 


CUADRO 8.18 
Datos empíricos del ejemplo 8.5 
persistencia (C) 
gravedad (B) | cl (baja) c2 c3 c4 (alta) 
b1 (leves) 4,5,2(a1) | 5,7,3 (a2) 1,0,1 (a4) 3,2,2 (a3) 


b2 7,8,5 (a2) | 5,3,2 (a3) 6,3,3 (al) 2,0,0 (a4) 
b3 6,3,2 (a3) | 1,1,1 (a4) | 9,8,11 (a2) 7,5,6 (al) 
b4 (graves) 2,3,1 (as) 5,4,6 (al) 8,7,5 (a3) 9,12,16 (a2) 


El diseño replicado resultante es un DCL: 4 x 4,n= 3, y debe también cumplir la condición de no 
interacción entre tratamientos y bloques. La prueba de aditividad de Tukey se utiliza con la finalidad de 
demostrar que el modelo es aditivo. En consecuencia, no son objeto de evaluación las interacciones AB, 
AC, BC y ABC. De hecho, excepto BC, no es posible calcularlas en programas como SPSS. 


SALIDA 8.17 
Análisis descriptivo de los datos del ejemplo 8.5 


Variable dependiente: mejora Variable dependiente: mejora 
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Nótese que en la salida 8.17 se ha prescindido de la representación de la columna para Media, así 
como de las sumas totales para las combinaciones de tratamiento, como se había utilizado en salidas 
anteriores, por limitaciones de espacio. Sin embargo, se ha incorporado ahora una columna para la Va- 
rianza que no se había contemplado anteriormente en la salida 8.14, porque en un diseño no replicado 
no se pueden calcular varianzas para cada combinación entre factores. También se ha prescindido de 
los descriptivos totales que pueden calcularse manualmente. 

Por su parte, los perfiles de medias de tratamiento representan prácticamente la misma tendencia 
que se observó en el ejemplo 8.4 y se representan en la figura 8.5 (compárese con la figura 8.4). Obsérvese 
que el mejor rendimiento se obtuvo sistemáticamente con el nivel a2. 


mejora.mean 
mejora.mean 


Figura 8.5. — Medias de tratamiento en función de la gravedad (B) y persistencia (C) de los síntomas. 


El cuadro 8.19 desarrolla el esquema de cálculo de las cantidades básicas y las sumas de cuadrados 
a partir de la salida 8.17 asumiendo como modelo básico el modelo más complejo, o sea, el modelo no 
aditivo. Observe en primer lugar que se estima como cantidad básica la interacción entre los factores de 
bloqueo (B x C), pero no se contemplan otras interacciones que violarían el supuesto de no interacción 
entre la estructura de tratamientos y la estructura de control, y que el componente de No aditividad sólo 
puede obtenerse por substracción. 

El correspondiente análisis de varianza se ha resumido en la salida 8.18. Obviamente, este modelo es 
susceptible de simplificación una vez que se ha comprobado si el componente de no aditividad (SCy a) 
es significativo, del mismo modo que se opera con un DBA o DCL replicado. Si lo fuera, el análisis 
de varianza debe incorporar este componente como una fuente de variación independiente, con sus 
correspondientes grados de libertad, como se recoge en la salida 8.18. Si no lo fuera, deberá fundirse 
en un término residual único el componente de no aditividad y el componente de error residual. En la 
salida 8.18 puede comprobarse que Fy (6,32) = 1.419; P = .238, y por tanto el modelo no aditivo no se 
ajusta aceptablemente. 
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CUADRO 8.19 
Resumen del procedimiento de cálculo del DCL:4x 4,n=3 


Cantidades básicas Procedimiento de cálculo No términos 

1) = 7?/na? (217)? /48 = 981.021 1 

AJ=E A5/nd 656)? /12+...+(13)2/12= 1300.75 a=4 

Bl=YE Bi/nd (35)2/112+...+(78)?/12=1070.417 b=4 

C]=E C?/nd (48? /12+...+(64)?/12= 1007.75 c=4 

BC]=E EBC¿,/n (102/3+...+ (6)2/3 = 1438.333 bc=(4)(4) =16 
R]=EE(M-DS;, (2)(2.333+1+...+0+1) = 80.667 (n— D)bc = (2)(16) = 32 
Sumas de cuadrados Procedimiento de cálculo Grados de libertad 
SCA=14)]-[1) 1300.75 981.021 =319.729 gla=3 

SCg =1B]- [11 1070.417 — 981.021 = 89.396 glg=3 

SCc =1C]-[1) 1007.75-— 981.021 = 26.729 glc=3 
SCya=1BC]-[4]-[B]-[C]+2[1] | 1438.333—...+ (2)(981.021) =21.458 | glya=6 
SCm=1BC]- [1] 1438.333 — 981.021 = 457.312 glm=15 

SCp =[R] 80.667 glp =32 

SCr =[BC]+[R]-[1] 1438.333 + 80.667 —981.021=537.979 | gly=47 


SALIDA 8.18 
ANOVA para el modelo no aditivo (ejemplo 8.5) 
Variable dependiente: mejora 
Fuentes SC MC 17 
Modelo 457.313 30.488 12.094 
tratamientos (A) 319.729 3 106.576 | 29.8034 
sintomas (B) 89.396 3 29.799 8.3324 
persistencia (C) 26.729 8.910 2.4914 
No aditividad (NA) 21.458 6 3.576 1.419? 
Residual 80.667 2.521 
Total 537.979 
2 MCna * MCr 


Puesto que el componente de No aditividad no resulta significativo, el modelo aditivo de la sali- 
da 8.19 suma el componente de no aditividad con el término de error residual, que es ahora es SCp = 
80.667 + 21.458 = 102.125, con g/g = 32 +6 = 38, por lo que se estiman sólo los tres efectos, un efec- 
to de tratamiento y dos efectos de las variables de bloqueo. Este modelo ajusta perfectamente ya que 
Fu(9,38) = 18.020; P < .001, y el efecto de los tratamientos es estadísticamente significativo: F4(3,38) = 
39.656, P < .001. Nótese que el efecto de las variables de bloqueo tienen un interés secundario, y se usan 
simplemente para verificar que representan conjuntamente una efectiva reducción de la varianza de 
error, de casi un 22% de la variación total. 
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SALIDA 8.19 
ANOVA para el modelo aditivo (ejemplo 8.5) 
Variable dependiente: mejora 
Fuentes SC MC 
Modelo 435.854 9 48.428 
tratamientos(A) | 319.729 3 106.576 


sintomas (B) 89.396 3 29.799 
persistencia (C) 26.729 3 8.910 
Residual 102.125 2.688 
Total 537.979 


La salida 8.19 incluye también una estimación de la magnitud del efecto de tratamiento con 1% = 
0.758, obtenida con SPSS, pero recuérdese que este índice no puede interpretarse como una proporción 
de varianza total explicada. Una estimación más apropiada, utilizando las razones F de la misma salida, 
puede obtenerse para el índice w* de Hays, donde 


(38.656) (3) 0.543 


AL a 
HA [(88.656)(3) + (10.088)(4) + (2.315)(4) +48]. =— 


lo que representa más del 54% de la varianza explicada. Además, la potencia observada de la prueba 
del efecto de tratamiento es óptima, ya que con gl; = 3, gl? = 38 y A = 119, el índice de potencia es 
$(3,38,119) = 1. 


8.6. EJEMPLOS DE DISEÑOS INTERSUJETOS CON COVARIANTES O 
VARIABLES DE BLOQUEO 


Como sucede con el DCA, el DBA también ha reducido sensiblemente su frecuencia de uso en favor 
delos diseños de medidas repetidas que tratamos en los dos capítulos siguientes. De hecho, el diseño de 
medidas totalmente repetidas se presenta en muchos textos (p. ej., Kirk, 2013) como un diseño típico de 
bloques aleatorios donde los bloques son los sujetos participantes. Un ejemplo ilustrativo de esta idea 
puede consultarse en un trabajo de Pasman, Van Baak, Jeukendrup y de Haan (1995). 

Una aplicación reciente del DBA puede consultarse en un trabajo de Gaggioli, Pallavicini y Morganti 
(2014), que se propusieron evaluar la eficacia de un nuevo paradigma ciberpsicológico (la interrealidad) 
para el manejo y prevención del estrés psicológico. La característica esencial de la interrealidad es un 
vínculo doble entre lo virtual y lo real logrado mediante escenarios virtuales completamente controla- 
dos por el terapeuta. La investigación utilizó un DBA con 121 participantes pertenecientes a dos dife- 
rentes poblaciones de profesiones (profesores y enfermeras) expuestas a estrés psicológico. La muestra 
de profesores (bloque 1, n = 61) se obtuvo en Milán y la de enfermeras en Messina (bloque 2, n = 60). 
Dentro de cada bloque, los participantes fueron aleatoriamente asignados a uno de tres grupos: (1) un 
grupo experimental (n = 40, 20 del bloque 1 y 20 del bloque 2) que recibieron un tratamiento de 5 sema- 
nas basado en el paradigma interrealidad; (2) un grupo de control (n = 42, 22 del bloque 1 y 20 del bloque 
2), que recibieron entrenamiento tradicional de manejo de estrés basado en terapia cognitiva conduc- 
tual también durante 5 semanas, y (3) un grupo de control de lista de espera (n = 39, 19 del bloque 1 y 
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20 del bloque 2) que no recibió tratamiento. Aunque los grupos que recibieron tratamiento redujeron el 
estrés percibido en mayor medida que el grupo de lista de espera, solamente los participantes en el gru- 
po experimental redujeron significativamente su ansiedad de rasgo crónica y mejoraron sus estrategias 
de afrontamiento. 

En una investigación de Conti y Musty (1984) se examinó el efecto del THC (el principal constituyen- 
te psicoactivo del cannabis) sobre la actividad locomotora en ratas. Los investigadores esperaban que 
dosis moderadas de THC mostrarían un mayor incremento en actividad locomotora. Después de una 
sesión de pretest, un total de 47 ratas fueron asignadas al azar a uno de cinco niveles de dosis de THC (0, 
0.1, 0.5, 1 y 2 mg). El nivel de actividad se midió en un intervalo de 10 minutos después de la inyección 
de THC. Los investigadores detectaron una considerable variabilidad en la actividad locomotora en el 
pretest, por lo que decidieron emplear la medida pretest como covariante en el contexto de un DVC 
con un factor intersujetos. El análisis de covarianza produjo un efecto significativo debido a la dosis, 
F(4,41) = 4.694; P = .003. Las pruebas post hoc confirmaron que el efecto del THC resultó mejor con 
niveles de dosis intermedios que con niveles extremos. 

Y finalmente, un trabajo de Meijer y Oostdam (2007) investigó la influencia de la ansiedad de prue- 
ba y el contenido de la instrucción (estresante versus tranquilizador) sobre la inteligencia. Se esperaba 
que los componentes de la ansiedad de prueba mostraran efectos diferenciales en la ejecución en seis 
tipos de prueba de inteligencia. Con esta finalidad se administraron las pruebas de inteligencia a 135 
estudiantes voluntarios de entre 10 y 13 años de edad, que pertenecían a 6 diferentes clases. La admi- 
nistración de cada test fue contraequilibrada para cada clase de acuerdo con un diseño de cuadrado 
latino. Los primeros tres tests para cada clase se administraron bajo condiciones de estrés y los tres úl- 
timos bajo condiciones de tranquilidad. Una escala apropiada fue utilizada para determinar el nivel de 
estrés percibido antes de cada serie de tests. El correspondiente DCL fue 6 (orden de test)x 6 (tipo de 
test). El efecto negativo de la ansiedad de prueba se observó al principio de la sesión y fue independiente 
del tipo de prueba. 


8.7. SUGERENCIAS DE ESTUDIO 


En cualquier texto clásico de diseño de experimentos se encontrará material para profundizar sobre 
los diseños de bloques aleatorios y cuadrado latino. Especialmente recomendables son Hinkelmann y 
Kempthorne (2008), Kirk (2013), Milliken y Johnson (1992) y Myers et al. (2010). En el texto de Maxwell 
y Delaney (2004) este tipo de diseños se tratan también desde la perspectiva de la comparación de mo- 
delos, la misma orientación que utilizamos aquí. 

Los diseños con variables concomitantes se tratan muy bien en el texto de Kirk (2013). También 
pueden servir algunos capítulos de una referencia clásica para modelos ANCOVA, el texto de Huitema 
(2011). La referencia más completa para los diseños de bloques aleatorios y cuadrado latino es Hinkel- 
man y Kempthorne (2008). 

En español, sigue siendo recomendable el texto del profesor Arnau (1984), pero también pueden ser 
de utilidad los textos de Ato y Vallejo (2007), Balluerka y Vergara (2002) y Palmer (2011), que presentan 
un tratamiento similar. 
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repetidas (intrasujetos) 


9.1. INTRODUCCIÓN 


En los diseños tratados hasta aquí (diseños DCA, DJE, DBA, DVC y DCL) los factores de trata- 
miento utilizados son de tipo INTERSUJETOS, porque a cada unidad experimental se le administra una, 
y solo una, de las combinaciones de las estructuras de tratamiento planificadas por el investigador. Los 
diseños que utilizan comparaciones intersujetos son especialmente apropiados para la INVESTIGACIÓN 
TRANSVERSAL (cross-sectional research). En contraposición, los FACTORES INTRASUJETOS se caracterizan 
porque a cada una de las unidades experimentales se les administran todas las condiciones de trata- 
miento. Los diseños que utilizan comparaciones intrasujeto se emplean profusamente en el contexto de 
la INVESTIGACIÓN LONGITUDINAL (longitudinal research) en Psicología y ciencias afines y tienen mu- 
chas variedades, algunas de naturaleza experimental o cuasiexperimental y otras de naturaleza no ex- 
perimental. Uno de los diseños de mayor trascendencia práctica que utilizan comparaciones intrasujeto 
es el DISEÑO DE MEDIDAS REPETIDAS (DMR). 

La estructura y naturaleza del DMR deriva directamente del DBA. En una situación donde hay una 
variable de bloqueo y un factor de tratamiento, si cada uno de los niveles de la variable de bloqueo es 
una unidad experimental, entonces el DBA se convierte en un DMR. Cuando los bloques son sujetos 
humanos, la variable de clasificación ya no es estrictamente una variable de bloqueo, sino una VARIABLE 
DE SUJETO. Además, hay tres diferencias importantes que conviene remarcar en la transición del DBA 
al DMR, a saber: 


— En primer lugar, puesto que cada unidad experimental que constituye un bloque recibirá todos 
los tratamientos, se genera una situación donde las unidades experimentales se encuentran en 
relación de cruce con los tratamientos. Dependiendo de la naturaleza del factor (o factores) de 
tratamiento, en ocasiones será posible asignar al azar los tratamientos a las unidades experimen- 
tales, pero en otras ocasiones no será posible. El diseño tendrá la consideración de experimental 
si alguna forma de aleatorización es posible con algún factor de tratamiento, cuasiexperimental 
cuando no sea posible, pero el factor haya sido manipulado, y no experimental cuando el factor 
no haya sido manipulado (p. ej., la variable tiempo). 


— Cuando las unidades experimentales reciben los tratamientos en un orden temporal predeter- 
minado, suelen aparecer efectos que sesgan las comparaciones intrasujeto llamados EFECTOS DE 
SECUENCIACIÓN, y que pueden ser de dos tipos generales: 
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+ EFECTOS DE ORDEN O ERROR PROGRESIVO (order effects), que son extrínsecos a la unidad ex- 
perimental, y se deben a la temporalidad en la recepción de los tratamientos. Pueden tener 
repercusiones positivas (EFECTO DE PRÁCTICA O familiaridad) o negativas (EFECTO DE FATIGA, 
frustración o desmotivación); 


+ EFECTOS RESIDUALES DE TRATAMIENTOS ANTERIORES (carry-over effects), también llamados 
EFECTOS DE TRANSFERENCIA (transfer effects”), que son intrínsecos a la unidad experimen- 
tal y representan procesos que el individuo pone en marcha durante la administración de 
nuevos tratamientos y que son consecuencia de la exposición a tratamientos previos. 


Sila variable intrasujeto es un factor manipulado, la utilización de la contraequilibración aleatoria 
(p. ej., secuencias aleatorias de recepción de los tratamientos para cada unidad experimental) es 
en general un procedimiento de control sustitutorio de la asignación aleatoria y en la mayoría de 
las ocasiones satisfactorio para equilibrar el sesgo producido por los efectos de orden y, en oca- 
siones, los efectos de transferencia. Pero no es posible utilizar secuencias aleatorias de recepción 
de tratamientos en investigaciones donde el tiempo es la variable independiente fundamental. 


— En segundo lugar, las variables de bloqueo representan en la mayoría de las ocasiones efectos 
aleatorios, aunque en ocasiones también pueden definirse como efectos fijos. Sin embargo, por 
su propia naturaleza una variable de sujeto asume una selección al azar de sus niveles (los sujetos 
participantes) de la población y por tanto supone siempre efectos aleatorios. Como consecuencia, 
cabe esperar que exista cierto grado de correlación entre las observaciones repetidas registradas 
para cada sujeto y será también probable que se incumpla el supuesto de independencia de las 
observaciones que se requiere en todas las aplicaciones del análisis de varianza. 


— Y en tercer lugar, los DMTR son, por su propia naturaleza, diseños no replicados. 


La característica esencial del diseño de medidas repetidas es que tiene dos tamaños diferentes de 
unidad experimental. El concepto de TAMAÑO DE LA UNIDAD EXPERIMENTAL procede de la investiga- 
ción agrícola, donde el diseño experimental se desarrolló originalmente, y parece haberse deformado 
al importarlo a la Psicología. Como consecuencia, el concepto de tamaño de unidad experimental re- 
sulta a veces difícil de comprender. Cuando cada uno de los sujetos de una muestra, que constituyen 
un bloque homogéneo, reciben todos los niveles de un factor de tratamiento no manipulado (por ejem- 
plo, momentos temporales) para evaluar su memoria, no son unidades experimentales diferentes cuya 
memoria se observa, sino una misma unidad que cambia con el paso del tiempo. Los diferentes sujetos 
que se extraen de la población constituyen unidades experimentales de tamaño mayor, con todas sus 
características personales y representan la variación intersujetos en un número infinito de caracterís- 
ticas, mientras que la memoria de cada unidad experimental que se observa en diferentes momentos 
temporales constituye un tamaño menor y representan la variación intrasujeto debida exclusivamente 
a diferencias en memoria. 

La principal consecuencia que tiene el concepto de tamaño de la unidad experimental es la des- 
composición del componente de error o residual en tantos componentes como diferentes tamaños de 
unidad experimental se hayan definido. 

Siguiendo a Arnau (1986) distinguimos dos grandes tipos de diseños de medidas repetidas: 


— El DISEÑO DE MEDIDAS TOTALMENTE REPETIDAS (también conocido como DISEÑO INTRASUJETO O 
DISEÑO DE TRATAMIENTOS POR SUJETOS), contiene un factor de tratamiento del tipo intrasujetos 
(sencillo) o más de uno (factorial), pero ningún factor de tratamiento intersujetos. 
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— El DISEÑO DE MEDIDAS PARCIALMENTE REPETIDAS contiene al menos un factor intersujetos y un 
factor intrasujetos. Este tipo de diseños se llaman también DISEÑOS MIXTOS porque combinan 
factores inter e intrasujetos. Es importante no confundir dos conceptos diferentes que se utilizan 
en este contexto: el diseño mixto es un diseño que mezcla factores inter e intrasujetos, mientras el 
enfoque mixto se refiere a una técnica de análisis que combina factores fijos y aleatorios. 


Seguiremos aquí una notación común para los diseños intrasujetos utilizando DMR de forma ge- 
neral para todos los diseños de medidas repetidas, pero distinguiendo los factores intersujetos de los 
factores intrasujeto, bien sea de forma textual (o sea, describiendo el tipo de factor), o bien mediante 
una notación bastante extendida, que representa los factores intersujetos como se ha tratado en los di- 
seños considerados hasta ahora, mientras que los factores intrasujeto se representan encerrados entre 
corchetes. En todos los casos, en la notación se indicará el número total de unidades experimentales 
utilizadas (n), que debe distinguirse del número de observaciones (NW), ya que el concepto de réplica no 
se aplica aquí (son, en realidad, pseudoréplicas). 

La figura 9.1 es un diagrama del DMR con un factor intrasujeto B (y por tanto un diseño de medidas 
totalmente repetidas) con 4 niveles de tratamiento, con notación DMR: [4], n = 6, siendo n el total de 
unidades experimentales utilizadas. Nótese que cada una de las 6 unidades experimentales representa 
un bloque, que recibe la estructura de tratamientos en un orden predeterminado, y por tanto se trata 
de una variable intrasujetos. De ahí que el gráfico no refleje el uso de la aleatorización en la asignación 
de los tratamientos a las unidades experimentales en este caso. Pero también el conjunto de los n = 6 
sujetos representa un grupo único de sujetos, y por tanto no hay ninguna variable intersujetos. 


2 | 
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ESTRUCTURA DE LOS TRATAMIENTOS 
(Sencillo 4) 


Figura 9.1. — Representación del diseño de medidas totalmente repetidas (intrasujetos). 


La figura 9.2 es un diagrama del DMR con un factor intrasujeto B, similar al de la figura 9.1, ahora 
con un grupo de n = 8 unidades experimentales. Nótese sin embargo que el grupo original se ha dividido 
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en dos subgrupos de 4 unidades experimentales cada uno de los cuales corresponde a un nivel del factor 
intersujetos A. La combinación de un factor inter y un factor intrasujetos constituye un DMR mixto o de 
medidas parcialmente repetidas. La notación que utilizamos en este caso es similar a la anterior, pero 
reflejando la naturaleza (inter o intra) de los factores: DMR : 2 x [4], n = 8, siendo de nuevo n el total 
de unidades experimentales participantes. La regla de asignación utilizada para repartir las unidades 


experimentales entre los grupos es importante, pudiendo ser aleatoria, no aleatoria pero sí conocida o 
no aleatoria ni conocida (véase capítulo 6). 
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Figura 9.2. — Representación del diseño de medidas parcialmente repetidas (mixto). 


Un gráfico comparativo entre los tres tipos de diseños experimentales (DCA, DBA no replicado y 
DMR) se exhibe en el cuadro 9.1 y muestra la conexión existente entre ellos: 


CUADRO 9.1 
Comparativa entre el DCA, el DBA no replicado y el DMR con un factor intrasujeto 
DCA DBA noreplicado DMR intrasujeto 


Factor A Factor A Factor A 
a2 Bloques Sujetos 
S2 b1 sl 


S5 b2 s2 
S8 b3 s3 
S11 b4 s4 
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— A la izquierda, el DCA: 3,n = 4, donde cada una de las 12 unidades experimentales existentes 
(S1 a S12) recibe al azar uno de los tres niveles de un factor A (aleatorización completa, porque 
el proceso de aleatorización no tiene ninguna restricción), constituyendo un conjunto de n = 4 
réplicas independientes. Hay por tanto 12 unidades experimentales, 4 réplicas y 12 observaciones. 
La estructura de control es experimental mediante aleatorización completa. 


— En el centro, el DBA:3x4,n= 1,0 noreplicado, donde se definen primero 4 bloques de 3 unidades 
experimentales cada uno. La pertenencia de la unidad a cada bloque viene determinada por el 
nivel de una variable de bloqueo. En cada uno de los bloques las unidades experimentales reciben 
al azar uno de los niveles de tratamiento (aleatorización restringida, porque la aleatorización se 
realiza dentro de cada nivel de la variable de bloqueo, o sea, tiene una restricción). Hay por tanto 
4 bloques de 3 unidades experimentales cada uno, 12 unidades experimentales, 1 réplica y 12 
observaciones. La estructura de control es experimental mediante bloqueo simple. 


— Ala derecha, el DMR: [3], n = 4, donde se seleccionan 4 unidades experimentales (S1 a S4) que 
reciben todos los tratamientos. Los niveles del factor A se administran siguiendo una regla de 
asignación no especificada a cada una de las unidades experimentales. Hay por tanto 4 unida- 
des experimentales y un total de 12 observaciones. La forma de control utilizada es experimental 
mediante bloqueo intrasujeto. 


9.2. DMRCON UN FACTOR INTRASUJETO 


El ejemplo 9.1 utiliza un total de n = 18 estudiantes universitarios que participaron en un estudio 
donde se examinó la intensidad de la respuesta emocional en una escala de 1 a 100 puntos producida 
durante la inspección de vídeos cortos que representaban diferentes contextos de violencia: un contexto 
escolar (a1), un contexto familiar (a2) y un contexto recreativo (a3). Un conjunto de expertos selec- 
cionaron de una videoteca 10 vídeos representativos de cada una de las situaciones. Cada estudiante 
inspeccionó cada uno de los videos en tres ocasiones separadas una semana en el tiempo siguiendo un 
orden determinado mediante contraequilibración aleatoria. 

Obsérvese que para cada estudiante se toman medidas repetidas de la intensidad de su respuesta 
emocional en tres semanas consecutivas, por lo que se pueden distinguir dos tamaños de unidad expe- 
rimental, en concreto: un tamaño mayor para el conjunto de las unidades experimentales, que forman 
un grupo único y representa una fuente de variación intersujetos, debida a diferencias individuales en 
respuesta emocional, y un tamaño menor para el conjunto de los contextos en que se registra la res- 
puesta de cada unidad, que representa una fuente de variación intrasujetos (factor contextos). 

Es importante destacar las dos formas de representación con que pueden aparecer los datos de un 
DMR. Este tema tiene importantes implicaciones porque, como tratamos más adelante, dependiendo 
de la forma de análisis que se elija, se requiere una u otra forma de representación. Afortunadamente, los 
paquetes estadísticos han desarrollado programas sofisticados para facilitar al investigador trasladarse 
de una a otra representación. 


— La representación más común para los datos empíricos de los DMR es la REPRESENTACIÓN MUL- 
TIVARIANTE, que se presenta en el cuadro 9.2 y reproduce, para cada sujeto, la intensidad de su 
respuesta emocional en los tres contextos (factor A). La variable de respuesta se contabiliza para 
cada combinación de sujeto y nivel de A. Para los datos del ejemplo 9.1, la representación mul- 
tivariante requiere 18 filas (una por sujeto) y 4 columnas (una columna para especificar el sujeto 
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participante y tres para cada uno de los niveles de A) y por economía es la más usual en artículos 
publicados. 


CUADRO 9.2 


Representación multivariante de los datos del ejemplo 9.1 


contextos 

al a3 
86 82 
80 8l 
84 84 
63 58 
60 61 
65 64 
51 55 
59 51 
52 56 
80 86 
89 8l 
65 63 
58 59 
56 64 
55 56 
53 60 
51 53 


1 
2 
3 
4 
5 
6 
7 
8 
9 
10 
11 


Rth 
NX Dd 004 


pu 
[e] 


— La representación multivariante es muy diferente a la utilizada en los diseños que hemos tratado 
en los capítulos 6 y 7, que emplean la REPRESENTACIÓN UNIVARIANTE tal y como se muestra en 
el cuadro 9.3. La diferencia entre ambas formas de representación es que mientras en la multiva- 
riante cada columna de datos corresponde a un nivel del factor intrasujeto y cada fila corresponde 
a un sujeto, en la representación univariante, por el contrario, cada columna de datos representa 
una variable y cada sujeto emplea tantas filas como niveles tiene el factor intrasujeto. Respecto al 
DCA, las puntuaciones de cada sujeto se dice que están agrupadas (clustered). 


CUADRO 9.3 
Representación univariante de los datos del ejemplo 9.1 


sujetos | contextos | respemo sujetos | contextos | respemo sujetos contextos | respemo 
1 al 85 7 al 54 13 al 63 

al 86 al 51 13 al 65 

a3 82 as 55 13 as 63 

al 8l al 62 14 al 65 

al 80 al 59 14 al 58 
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Para los datos de este ejemplo, la representación univariante requiere 54 filas (3 filas por sujeto, con 
3 x 18 = 54 observaciones), y 3 columnas correspondientes a las tres variables. 

La salida 9.1 presenta un análisis descriptivo de los datos. Nótese que se han separado los esta- 
dísticos descriptivos para el factor intrasujeto contextos (la estructura de los tratamientos, en la parte 
superior) y para el factor sujetos (la estructura del control, en la parte inferior), para el que solamente se 
representa la suma. La figura 9.3 es un gráfico de las medias de grupo con barras de error al 95%. 


SALIDA 9.1 
Análisis descriptivo — estructura de los tratamientos 


Matriz de covarianzas 
contextos al al a3 
al 147.703 161.513 148.255 
al 161.513 190.565 164.922 
a3 148.255 164.922 160.471 


sujetos 
Suma 
sujetos 
Suma 


70.0 - 


respemo 


65.0- 


1 1 1 
al a2 a3 


contextos 


Figura 9.3. — Promedios y barras de error de respemo en función del nivel de contextos. 
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9.3. ENFOQUES ANALÍTICOS PARA EL DISEÑO DE MEDIDAS REPE- 
TIDAS CON UN FACTOR INTRASUJETOS 


El análisis estadístico de los diseños de medidas repetidas presenta muchas complicaciones que son 
en gran medida consecuencia de la violación del supuesto de independencia de las observaciones que 
se asume en este tipo de diseños. Tratamos aquí los principales procedimientos que se han utilizado pa- 
ra analizar datos con DMR en psicología y disciplinas afines, a saber, el ENFOQUE UNIVARIANTE CLÁSI- 
Co, que utiliza la representación univariante, el ENFOQUE MULTIVARIANTE, que utiliza la representación 
multivariante y se propuso como alternativa al enfoque univariante clásico, y el ENFOQUE MIXTO, que es 
un enfoque reciente desarrollado para superar los inconvenientes de los dos anteriores y utiliza también 
la representación univariante. Un tratamiento más profundo de todas las alternativas analíticas puede 
consultarse en Davis (2002). 

Abordamos a continuación una comparativa entre estos tres enfoques para el caso del DMR con un 
factor intrasujeto. Como punto de partida de esta comparativa, si se verifica que no existe correlación 
entre las medidas repetidas para el grupo de 18 sujetos, y que presentan puntuaciones altamente ho- 
mogéneas, el investigador podría utilizar ANOVA de un factor intersujetos y considerar n = 18 réplicas 
para cada uno de los tratamientos como si se tratara de un DCA. Para el ejemplo 9.1, el resultado sería 
F1(Q2,51) = 0.468; P = .629 concluyendo que no hay diferencias significativas en la respuesta emocional 
alos diferentes contextos de violencia (salida 9.2). 


SALIDA 9.2 
ANOVA en un sentido para los datos del ejemplo 9.1 


Variable dependiente: respemo 
Fuente SC tipo III MC 
Modelo 155.4444 2 | 77.7224 


A (contextos) 155.444 TITLE 
Residual 8478.556 166.246 
Total 8634.000 
4 MC Residual 


El ANOVA de la salida 9.2 conduce a una conclusión incorrecta porque el registro de medidas repe- 
tidas para los mismos sujetos genera algún grado de correlación y violan por tanto el supuesto de in- 
dependencia sobre el que se fundamenta el análisis. En concreto, se consideran como independientes 
observaciones de la misma unidad experimental registradas para los tres niveles del factor intrasujetos. 


9.3.1. Enfoque univariante clásico (ANOVA de un factor intrasujetos) 


Si se asume que las observaciones se distribuyen normalmente, una primera opción analítica es una 
derivación del modelo ANOVA no replicado para un DBA, donde cada bloque representa un sujeto. 
Asumiendo un modelo estadístico correspondiente con un factor fijo (el proceso puede generalizarse 
con facilidad si es aleatorio) y no interacción entre sujetos y tratamientos (modelo aditivo), la ecuación 
del modelo es: 


Y¡¡=M+S¡+0j¡+€jj (9.1) 
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donde y es la media global, s; = 1; — y son efectos aleatorios que varían sobre el conjunto de sujetos 
independientemente de los tratamientos y se suponen distribuidos según NID(0,0?), a ¡=Hj-pson 
efectos fijos constantes para cada nivel de tratamiento independientemente de los sujetos y e;;= Y;¡— 
u— s¡— a; son efectos residuales aleatorios específicos de cada observación que se suponen distribuidos 
según NID(O, a El modelo de la ecuación 9.1 contiene por tanto un término de efectos fijos (« Ny dos 
términos de efectos aleatorios (s; y e;;) y por tanto se trata de un MODELO DE EFECTOS MIXTOS. 

De forma similar al DBA, en este diseño u+a ; es la estructura de los tratamientos, s; es la estructura 
de control, que en este contexto es una forma de control experimental denominada BLOQUEO INTRASU- 
JETO, porque cada sujeto es un bloque que recibe todos los niveles del factor intrasujeto, y s; y e;¡ forman 
una estructura múltiple de error. Al tamaño mayor de unidad experimental (componente de error inter- 
sujetos) le corresponde el término s; del modelo de la ecuación 9.2, mientras que al tamaño menor de 
unidad experimental (componente de error intrasujeto) le corresponde el término e;;. 

La esperanza matemática y la varianza de las observaciones Y;¡ son 


E(Yi;) = E(U+s¡+0j5+e¡¡)=u4+0j (9.2) 
Vi) = Víu+s;:+a¡+ej)=0%+0% (9.3) 
(puesto que u y a; son efectos fijos constantes), y sus correspondientes covarianzas son 
C(Yij Yy¡) = 0,paratodoiAXi' (9.4) 
C(Yij Yi) = 0% paratodo ¡A j' (9.5) 


En consecuencia, aunque las dos variables aleatorias del modelo de la ecuación 9.2 (s; y e¡;¡) se asumen 
independientes, las observaciones repetidas para un sujeto se asumen por lo general correlacionadas. 
Más adelante tratamos con mayor detalle las propiedades de la matriz de covarianza resultante. 

El proceso de cálculo de las cantidades básicas y las sumas de cuadrados para el enfoque univariante 
clásico se desarrolla en el cuadro 9.4. 


CUADRO 9.4 
Resumen de cálculo de las Sumas de Cuadrados del DMR: [4],n= 18 


Cantidades básicas 


Procedimientos de cálculo 


No términos 


11] = 7?/an (3654)? /54 = 247254 1 

[4] =YE Aín 11261)? + (1193)? + (1200)?]/18 =247409.444 a=3 

[S] =E St/a [(253)? + (2422 +...+ (175) + (161)?]/3 = 255460 | n=18 

[R] = E (n- DSi (17)(147.703) +...+(17)(160.471) = 8478.556 (n-Da=51 
Sumas de cuadrados Procedimientos de cálculo Grados de libertad 
SCA=14)-[1) 247409.444— 247254 = 155.444 a-1=2 

SCs=1[S] [1] 255460 — 247254 = 8206 n-1=17 


SCr = [R] — [S] + [1] 


8478.556 — 255460 + 247254 = 272.556 


(a- D(n-1)=34 


SCm = SCA +SCs 
SCT =SCm+SCRr 


155.444 + 8206 = 8361.444 
8361.444 + 272.556 = 8634 


a+n-2=19 
N-1=53 
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El cuadro 9.5 presenta una tabla ANOVA general para un DMR con un factor fijo intrasujeto (4) y 
un factor aleatorio intersujetos (S), y desarrolla las E(MC) asumiendo un modelo aditivo o no aditivo 
dependiendo del resultado de la prueba de aditividad de Tukey que tratamos en el capítulo anterior. 
Todo el interés del diseño recae en la prueba del factor de tratamiento intrasujetos A, que utiliza siem- 
pre como denominador MCz aunque no se verifique la condición de independencia entre sujetos y 
tratamientos. Sin embargo, la prueba será sesgada cuando o?,, sea distinta de cero. 

Puede resultar instructivo comparar el modelo ANOVA de un factor intersujetos y el modelo ANOVA 
de un factor intrasujetos para constatar que el término residual del segundo, AS, será igual o más pe- 
queño que el primero, S(4), como consecuencia de la inclusión del factor S (véase figura 9.4). Como 
consecuencia, el modelo ANOVA de un factor intrasujetos será siempre más preciso y más eficiente que 
el modelo ANOVA de un factor intersujetos para probar el efecto del tratamiento. 


CUADRO 9.5 
Tabla ANOVA para un DMR con un factor intrasujetos 


Sumas de Grados de E(MC) E(MC) 
Fuente cuadrados libertad modelo aditivo | modelo no aditivo F 
S (Sujetos) SCs n-1 a+ ac? +0? .+a0? MCs/MCr 


A (Tratamientos) SCa a-1 a+ n82 +0? +02 MCA/MCp 


Residual SCr (a-D(n-1) | 0% o? + 0. 
Total SCT an—-1 


Componente 
S(A) intersujetos 


BxS(A) 


Componente 
intrasujetos 


AB | AB 


Figura 9.4. — Comparativa de la partición de la SCf en el DCA y el DMR. 


Nótese que la descomposición de la SCr consta de dos fuentes de variación para el DCA, A y residual 
S(4), que se convierten en tres en el DMR, una de las cuales corresponde a A y las otras dos son errores 
residuales, residual intersujetos, que corresponde a S, y residual intrasujetos, que corresponde a AS. 
Cada uno de los dos errores residuales se asocian con dos entidades distintas de unidad experimental. 

Como sucede con los DBA no replicados, antes de proceder al análisis, es necesario aplicar la prueba 
de aditividad de Tukey para determinar si se cumple el supuesto de independencia entre estructura de 
los tratamientos y estructura del control. El resultado se resume en la salida 9.3 junto con los resultados 
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del ANOVA univariante clásico. Para obtener el componente de no aditividad se subdivide el componen- 
te Residual, con 34 grados de libertad, en una parte que se atribuye al componente de no aditividad 
(SCyva = 13.285), con un grado de libertad, y otra parte no atribuible al componente de no aditividad, 
con 33 grados de libertad, que es la Diferencia respecto del Residual intrasujetos. Este análisis es similar 
al que se practica con el DBA no replicado (véase salida 8.9). En este caso, la prueba de aditividad no 
resulta significativa: Fy (1,33) = 1.691, P =.202, y por tanto se acepta la hipótesis (nula) de aditividad y 
se concluye que las estructuras de tratamiento y de control son independientes y que el modelo óptimo 
es el modelo aditivo. El investigador puede descartar entonces la última parte de la salida 9.3 y concen- 
trarse en la primera, que es un ANOVA univariante clásico con el modelo aditivo. Pero en el caso de que 
la prueba de aditividad resultara significativa, y por tanto se rechazara la hipótesis nula de aditividad, 
al pie de la salida 9.3 se especifica la potencia a la que habría que elevar las puntuaciones de la variable 
de respuesta para obtener aditividad. En el ejemplo 9.1, la nueva variable de respuesta (Y”) se obtendría 
elevando la original (Y) a la potencia 2.605, o sea, Y' = y2-505 Obviamente, una opción más simple sería 
corregir el error residual restándole el componente de no aditividad y probar los efectos con el error 
residual corregido. 
SALIDA 9.3 
Tabla ANOVA con la prueba de aditividad de Tukey 
Variable dependiente: respemo 
Fuente SC tipo III MC 

Modelo 8361.444 440.076 
Intersujetos 
sujetos 8206.000 482.706 
Intrasujetos 
contextos 155.444 77722 
Residual 272.556 8.016 
Componente NA 13.285 13.285 
Diferencia 259.271 7.857 
Total 8634.000 


4 Potencia de la transformación para conseguir aditividad = 2.605 


Por lo demás, aplicando el modelo aditivo de la ecuación 9.1, esta partición de la variación re- 
sidual en dos componentes independientes, uno intersujetos y otro intrasujetos, permite una prue- 
ba F más precisa y eficiente del factor intrasujetos contextos. Con el enfoque univariante clásico, el 
efecto factorial del factor contextos es estadísticamente significativo: F1(2,34) = 9.695; P < .001, una 
conclusión diametralmente opuesta a la obtenida en la salida 9.2 asumiendo réplicas independientes: 
FAQ,51) = .468; P = .629. La diferencia reside en la considerable magnitud en sumas de cuadrados que 
se atribuye al componente sujetos. De hecho, la eficiencia relativa del DMR con un factor intrasujeto 
(salida 9.3), analizado con el enfoque univariante clásico, respecto del DCA asumiendo réplicas inde- 
pendientes (salida 9.2) es casi del 97%: (8478.556— 272.556)/8478.556 = .968. 

El modelo de la ecuación 9.1 es un modelo parsimonioso y de fácil aplicación para el análisis del 
DMR con un factor intrasujeto que representa el enfoque univariante clásico. Sin embargo, tiene varios 
inconvenientes que es preciso resaltar: 


— Para el conjunto de unidades experimentales, las medidas repetidas deben tener la misma varian- 
za en cada nivel del factor intrasujetos (homogeneidad de varianzas) y la misma correlación entre 
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los diferentes niveles de factor. Este supuesto se denomina ESFERICIDAD, pero desde el enfoque 
univariante clásico y la representación univariante no es posible saber si se cumple o no. Bajo este 
supuesto, puede afirmarse que F4(2,34) = 9.695, P < .001, pero si el supuesto no se verifica el re- 
sultado no tiene ninguna aplicabilidad. Para comprender mejor este inconveniente necesitamos 
profundizar algo más en el concepto de estructuras de covarianza y en los supuestos sobre los que 
se fundamenta el enfoque univariante (véase sección 9.3.2). 


— No es posible aplicar comparaciones a posteriori entre medias de grupo. Las medias de grupo no 
pueden asumirse independientes en los diseños de medidas repetidas. De hecho, muchos progra- 
mas estadísticos (p. ej., SPSS) excluyen esta opción, mientras que otros programas lo permiten, 
produciendo resultados sesgados. 


— Debido a la representación univariante que asume, la pérdida de una observación para una uni- 
dad determinada implica que todas las medidas repetidas para tal unidad son afectadas. Se produ- 
ce un problema de datos perdidos cuya solución pasa o bien por eliminar todas las observaciones 
de la unidad afectada o bien imputar los datos perdidos. 


9.3.2. Estructuras de covarianza y diseños intrasujetos 


Los supuestos típicos del modelo ANOVA para un factor intersujetos (normalidad, homocedasti- 
cidad e independencia) especifican que las distribuciones para cada nivel del factor son aproximada- 
mente normales, que sus varianzas son homogéneas y que todas las observaciones son mutuamente 
independientes. En particular, este último supuesto se cumple cuando cada una de las observaciones 
se registra con una unidad experimental diferente (es decir, con diseños intersujetos), pero es difícil 
que se cumpla con diseños intrasujetos puesto que las observaciones repetidas sobre la misma unidad 
necesariamente presentan algún grado de correlación. 

Es muy instructivo visualizar con matrices de covarianza el cumplimiento y la violación de los su- 
puestos del modelo ANOVA. Además, conviene tener en cuenta que el objetivo del enfoque mixto es la 
estimación de los efectos fijos de los factores intersujetos (modelando sus medias), así como de los efec- 
tos aleatorios de otros factores intersujetos y de los efectos repetidos del factor intrasujetos (modelando 
sus varianzas y covarianzas). Para fundamentar las explicaciones sobre los supuestos que subyacen a los 
DMR haremos uso de algunas de las estructuras que puede presentar una matriz de covarianza. 

La matriz de covarianza empírica S(Y) para aplicar ANOVA de un factor intrasujetos A con a trata- 
mientos es, promediando para el conjunto de las unidades experimentales: 


Sí $12 Sla 
2 
$21 $) ... S2g 
SY) = d a E (9.6) 
2 
Sal Sa2 Sa 


donde los elementos diagonales (st, e Ne] son varianzas, los elementos no diagonales ($12, $14, $24) SON 
covarianzas y la matriz se asume simétrica ya que $12 = $21, $14 = Sal Y S2a = Saz. La matriz de covarianza 
empírica S(Y) es obviamente un estimador de la matriz de covarianza de la población (2): 
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0 01 Ola 
2 
021 0) ... TO2q 
2NE= ; a . (9.7) 
2 
Cal UÚal Ca 


La más compleja (y menos estructurada) de todas las matrices de covarianza se representa en la 
ecuación 9.7 anterior, que requiere estimar un total de [(a)(a + 1)]/2 parámetros de varianzas y cova- 
rianzas. Puesto que se trata de una matriz de covarianza que estima todos los parámetros posibles se 
denomina MATRIZ DE COVARIANZA NO ESTRUCTURADA (NE). El interés de esta estructura de covarianza 
es que sus estimadores revelan al investigador el patrón observado de varianzas y covarianzas. 

En cambio, la más simple (y más estructurada) de todas las matrices de covarianza es aquella donde 
se verifican los supuestos de homocedasticidad e independencia, en cuyo caso la matriz de covarianza 
resultante para cada sujeto ¡ es la siguiente: 


O 0 1.0 0 
0 a es 0 NA 

21 = ] pr E IS o ls al (9.8) 
0 0 Pe 0.0 1 


donde 0? representa la varianza de error o residual del modelo e Les una matriz identidad. Los supuestos 
de homogeneidad e independencia son razonables en el DCA, donde las réplicas son unidades expe- 
rimentales independientes y la asignación de los tratamientos a las unidades experimentales se realiza 
aleatoriamente, pero no es razonable en un DMR. La estructura de covarianza de la ecuación 9.8 es muy 
parsimoniosa, porque requiere estimar un solo parámetro (0?) de la matriz de covarianza, pero también 
es muy restrictiva, porque reduce a uno todos los [a(a+ 1)]/2 parámetros de la matriz de covarianza. Se 
llama MATRIZ DE IDENTIDAD ESCALADA (1E) porque representa el producto del parámetro de escala a? 
por una matriz identidad (como muestra también la ecuación 9.8). 

La aplicación de ANOVA con un factor intrasujeto precisa cumplir supuestos más restrictivos sobre la 
matriz de covarianza, que pueden considerarse como una generalización de los supuestos de homoce- 
dasticidad e independencia del ANOVA de un factor y que se requiere para que la razón F4 = MCA/MCr 
que se emplea para probar la hipótesis nula tenga propiamente una distribución F con gl¡ = a—1 y 
gl) = (a— 1)(n— 1). Así, cuando la matriz de covarianzas JE no cumple el supuesto de homocedasti- 
cidad pero sí el supuesto de independencia se obtiene una matriz menos parsimoniosa, que requiere 
a parámetros, o sea, tantos parámetros como niveles tiene el factor intrasujetos. Se llama MATRIZ DE 
COMPONENTES DE LA VARIANZA (CV) y se formula así: 


o 0 0 
E 
o E (9.9) 
e 
0.0 TG 
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Utilizando las ecuaciones 9.3 y 9.5, la estructura de la matriz de covarianza requerida para aplicar el 
modelo de la ecuación 9.1 es, para cada sujeto i, la siguiente: 


20 2 
a5+ 0% OS OS 1 pr PI 
2 2442 2 
OS OS+ 06 OS E lo... pr 
2sc= . ] . : =05 +06 |. e q (9.10) 
2 2 Z4 2 
OS OS a5+ 0% PI Pio. 1 


donde 0? es la variación intrasujeto para el ¡-ésimo sujeto y p, es la correlación entre las observaciones 
de un nivel del factor o CORRELACIÓN INTRACLASE p¡ = 0? /(0? + 07). Esta estructura corresponde a una 
matriz de covarianza denominada SIMETRÍA COMPUESTA (SC), que se caracteriza porque los elementos 
diagonales son las varianzas de cada uno de los niveles del factor intrasujeto que se asumen homogé- 


neas (es decir, 0% = 0? +07 es igual para todos los elementos diagonales), y los elementos no diagonales 


son las covarianzas entre pares de niveles del factor intrasujeto, ¡ y j', que se asumen también homo- 
géneas (0 sea, 0 ¡¡: = 0? es igual para todos los elementos no diagonales). Esta estructura implica que la 
correlación entre cualquier par de medidas repetidas es la misma, independientemente de la distancia 
existente entre ambas medidas. Es una estructura bastante parsimoniosa, que solamente requiere esti- 
mar dos parámetros (0? y 02), pero por tal razón es también bastante restrictiva. Esta es la estructura 
que se asume cuando se emplea el enfoque univariante con el modelo de la ecuación 9.2. Pero si no se 
cumple el supuesto de simetría compuesta, la prueba F será positivamente sesgada y se producirá un 
incremento de la tasa de error tipo l. 

Todas las matrices de covarianza que se utilizan con diseños de medidas repetidas se definen uti- 
lizando variaciones del supuesto de homogeneidad de las varianzas y del supuesto de independencia 
de las observaciones. La matriz que no cumple con ninguno de los dos supuestos es la matriz no es- 
tructurada (ecuación 9.7), que requiere [(a)(a+1)]/2 parámetros diferentes. La matriz que cumple con 
los dos es la matriz de identidad escalada (ecuación 9.8), que requiere un único parámetro. La matriz 
de simetría compuesta (ecuación 9.9) es una matriz que asume varianzas homogéneas, y requiere dos 
parámetros, pero también puede definirse una matriz de SIMETRÍA COMPUESTA HETEROGÉNEA (SC H), 
como la que se representa en la ecuación 9.11: 


| o o? os | 
o 0 se 0 
2scH= ; ¿Ta z (9.11) 
2 2 2 
Cs Cs Ta 


donde las a varianzas di Á 05 A Á a? se asumen heterogéneas, mientras que las covarianzas o? se 


asumen iguales u homogéneas. Nótese que esta matriz requiere a+1 parámetros para ser estimada. 
Todas las matrices de covarianza pueden construirse asumiendo que sus varianzas son homogéneas o 
heterogéneas. 

Lo mismo puede afirmarse del supuesto de independencia de las observaciones. Para cualquier ma- 
triz, las covarianzas pueden asumirse igual a cero (independencia de las observaciones ), o iguales (ho- 
mogeneidad de las covarianzas) o desiguales entre sí (heterogeneidad de las covarianzas). La matriz de 
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identidad escalada JE es el ejemplo típico del primer caso, la matriz de simetría compuesta SC es un 
ejemplo del segundo caso y la matriz NE es un ejemplo del tercero. 

Otras pautas más complejas que violan el supuesto de independencia pueden obtenerse definiendo 
estructuras de correlación entre los niveles de las medidas repetidas. Por ejemplo, supongamos que la 
pauta de resultados que un investigador observa al estimar la matriz de covarianza NE para un factor 
intrasujetos con 4 niveles revela que las covarianzas disminuyen con el tiempo en que se registra la 
medida repetida, siendo mayor la correlación entre medidas en el nivel 1 y menor en el nivel 4. En tal 
caso, el investigador puede optar por utilizar para modelar las medidas repetidas la matriz de covarianza 
AUTORREGRESIVA DE ORDEN l: 


a dp ap ap 
2 2 2,2 
O O o o 
Zar = pa a?p (eS za (9.12) 


ap 0p pp 0 


. La ¡/ .. . . 
donde 0 25d 0% son varianzas y p?Y es la correlación cuyo valor depende del nivel de la medida repe- 


tida. Para el elemento (1,1) q” = (, para el elemento (2,1) o (1,2) pa = p. = p, para el elemento (3,1) 
o (1,3) paar = ps para el elemento (4,1) o (1,4) pe! e pe etc. Esta matriz es muy parsimoniosa porque 
requiere solo dos parámetros: o? y p. Si por el contrario, se asumiera que las varianzas son heterogéneas, 
el resultado sería sería la matriz de covarianza AUTOREGRESIVA HETEROGÉNEA DE ORDEN 1, que requiere 


cinco parámetros (0%, 0%; OS] ln y P): 


2 2 3 
Oi 0102P 0103P 0104P 
2 2 
y 14 0201P 0% 0203pP 0204P 9.13 
ARH1= 2 2 (9.13) 
0301]1P 0302P 03 0304P 
3 2 2 
0401P 0402P 0403P 4 


9.3.3. El supuesto de esfericidad 


El supuesto de simetría compuesta es intuitivo y fácilmente comprensible si se visualiza con la ayuda 
de una matriz de covarianza. Sin embargo, Huynh y Feldt (1970) demostraron que es innecesariamente 
restrictivo. Un supuesto menos restrictivo es el SUPUESTO DE ESFERICIDAD, o similarmente, el SUPUESTO 
DE CIRCULARIDAD,' que asume iguales las varianzas de las diferencias entre todos los pares de niveles 
del factor intrasujetos. La denominada condición de Huynh-Feldt establece que la esfericidad es la con- 
dición necesaria y suficiente para considerar correcta la aceptación o el rechazo de la hipótesis nula 
mediante la prueba F en base a valores empíricos de probabilidad. 

Una matriz de covarianza se dice que cumple esfericidad cuando son iguales (o sea, constantes u 
homogéneas) las varianzas de las diferencias entre los niveles de tratamiento ¡ y j' (as. ,). Utilizando la 


matriz de covarianza estimada puede comprobarse si se cumple esfericidad calculando 


l Ambos supuestos son formalmente equivalentes, pero el supuesto de esfericidad requiere para su definición una transfor- 
mación ortogonal normalizada de la matriz de covarianzas y la utilización de álgebra de matrices, mientras que el supuesto de 
circularidad se aplica directamente a la matriz de covarianzas no transformada y puede desarrollarse con álgebra escalar. En lo 
que sigue utilizaremos indistintamente ambos términos. 
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Pe O a 
Sq,,=07+05 20, =22 (9.14) 


= ——-A (9.15) 


La MATRIZ DE COVARIANZA ESFÉRICA (SP, de spherical o también exchangeable) es la forma más sim- 
ple de representar el supuesto de esfericidad, que asume que todas las medidas repetidas tienen la mis- 
ma correlación: 


A el E lp P 
op 0? da ap s p 1 eva p 

2sp= : e ; 00 ; (9.16) 
op 0? Gra 0? p Pp ana 1 


A partir de la ecuacion 9.14 puede también definirse la MATRIZ DE COVARIANZA DE HUYNH-FELDT 
(HP), que sigue el patrón siguiente: 


2 2 2 2 
| 0? 0407 o O +0 | 
as e Ea 
=2 05 =—-1 
Sure 2 2 (9.17) 
2 2 2 2 
Cd +07 2 ¿+0 2 po 
2 2 iS 


donde a?, ..., 02 son varianzas y 1 es una constante independiente de los niveles ¡y ¡'. La matriz asume 
1 a 


varianzas heterogéneas y covarianzas que dependen de las varianzas de fila y columna y de la constante 
A. Su estimación requiere por tanto a+ 1 grados de libertad. 

Nótese que aunque el supuesto de simetría compuesta es una condición suficiente para que el es- 
tadístico F tenga una distribución F, con a— 1 y (a— 1)(n-— 1) grados de libertad, no es una condición 
necesaria para que se cumpla esfericidad. Es decir, si se cumple el supuesto de simetría compuesta se 
cumplirá el supuesto de esfericidad, pero es posible encontrar esfericidad sin que exista simetría com- 
puesta. 

Conviene también tener en cuenta que los datos empíricos raramente exhiben esfericidad (o sime- 
tría compuesta) perfectas. Una prueba estadística para probar el grado de esfericidad de una matriz 
de covarianzas fue propuesta por Mauchly (1940). La PRUEBA DE MAUCHLY se distribuye aproximada- 
mente según xy? con a—1 grados de libertad y varía de 0 a 1, donde O corresponde a una matriz de 
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covarianza que presenta una desviación máxima del patrón de esfericidad y 1 corresponde a una matriz 
de covarianza que presenta esfericidad perfecta. Sin embargo, el empleo de la prueba de Mauchly no es 
universalmente aceptado. En concreto, no produce resultados válidos cuando los datos se desvían de la 
normalidad o en el caso de tamaños muestrales pequeños (p. ej., n < 10). Sin embargo, es una prueba 
que incluyen la mayoría de los paquetes estadísticos profesionales. 

Cuando no se cumple el supuesto de esfericidad, Box (1954) y Geisser y Greenhouse (1958) demos- 
traron que el estadístico F4 para probar la hipótesis nula de que no hay efectos debidos al factor intra- 
sujeto se distribuye según Fe(a-—1),e(a-1)(n-1) donde € (EPSILON) es un parámetro que evalúa el grado de 
violación del supuesto de esfericidad. El parámetro e se utiliza para corregir tal violación reduciendo los 
grados de libertad de numerador y denominador de la razón F y es función de la matriz de covarianzas 
empírica S(Y) = 2 (ecuación 9.6). Se define mediante la fórmula siguiente: 


a? (0-0) 
€ 66 = ——————————— AT (9.18) 
(a-1)|EXo;)- (Lar 7) +(ao”) 


donde 9;; es el elemento de la fila ¡ y la columna ¡ de la matriz de covarianza 2, 0 ¡; es la media de los 
valores diagonales de 2, y es la media de todos los elementos de 2 y 7; es la media de los valores de la 
fila ¡ de 2. 

El criterio estadístico e varía en el rango 1 (cuando hay esfericidad perfecta) a 1/(a—1) (cuando hay 
violación máxima de la esfericidad). Cuando es 1, no se aplica corrección de los grados de libertad de 
numerador y denominador de la prueba F. En la medida que se desvía de 1 y se aproxima a 1/(a—1), 
la corrección a la baja de los grados de libertad es tanto mayor. Greenhouse y Geisser (1959) propusie- 
ron también una versión ultraconservadora de e, que coincide con el valor límite inferior del índice: 
eL = 1/(a— 1), y aconsejaron su utilización fundamentalmente ante casos severos de violación de la 
esfericidad. SPSS incluye esta versión ultraconservadora de e en sus salida s. Para casos menos severos, 
Huynh y Feldt (1976) propusieron una modificación de e que formularon como: 


_ nla-De-2 
“(a-Din-1-(a-1€] 


EHF (9.19) 


La cuestión fundamental que se plantea en un DMR es la prueba de la hipótesis nula de que no hay 
efectos debidos al tratamiento. Es usual utilizar primero la razón F¿ del DMR con un factor intrasujeto, 
de tal modo que si la prueba no es significativa, lo más sensato será aceptar la hipótesis nula porque 
cualquier ajuste ulterior no hará la prueba significativa. El problema se presenta cuando la prueba es 
significativa. Si el supuesto de esfericidad se cumple, la conclusión de rechazar la hipótesis nula es co- 
rrecta. Pero si se incumple el supuesto de esfericidad, el enfoque univariante no es válido y no debe ser 
utilizado. En tal caso hay varias alternativas posibles a emplear: 


— el enfoque multivariante, que no requiere el cumplimiento del supuesto de esfericidad, y consiste 
en utilizar criterios estadísticos multivariantes y una aproximación exacta a la razón F,; 


— el ajuste de los grados de libertad de numerador y denominador del estadístico F utilizando el 
límite inferior £cG, en cuyo caso el estadístico F se distribuye según F (n-1), produciendo una 
prueba ultraconservadora. Si la razón F resulta significativa con esta corrección, lo más sensato 
es rechazar la hipótesis nula de que no hay efectos debidos a tratamiento; 
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— el ajuste de los grados de libertad del numerador y denominador de F propuesto originalmente 
por Box y ampliado por Greenhouse y Geisser, ea, que produce también una prueba conserva- 
dora. Este ajuste también resulta excesivamente sesgado cuando e > .75y n<2a. 


— el ajuste de los grados de libertad del numerador y denominador de F propuesto por Huynh y 
Feldt (1976), €4F, que produce también una prueba conservadora aunque con mejor comporta- 
miento que el ajuste clásico de Box, Greenhouse y Geisser. 


Para ilustrar estos conceptos utilizaremos los dos conjuntos de datos que se muestran en los cuadros 
9.6 y 9.7, y que llamaremos respectivamente conjunto A y conjunto B, que corresponden a un DMR: 
[3], n = 6 utilizando para ello la representación multivariante. Ambos conjuntos representan también 
en sus tres últimas columnas las diferencias entre los niveles 1 y 2 (variable 421 = a2— al), los niveles 1 
y 3 (variable 431 = a43-— al) y los niveles 2 y 3 (variable 432 = a3 — a2). Para cada una de las columnas, 
todos los cálculos relativos a medias y varianzas/covarianzas se muestran en las dos últimas filas de 
cada cuadro. 


CUADRO 9.6 
Conjunto A de datos empíricos cona=3 yn=6 


Conjunto A 

sujetos d21=a2-al | d31=a3-al | d32= a3- a2 
sl -11 17 

s2 -17 

s3 
s4 
s5 
s6 
medias 13.167 8.500 13.000 4.500 
varianzas | 121.867 189.100 191.200 191.900 


CUADRO 9.7 
Conjunto B de datos empíricos con a=3 yn=6 


Conjunto B 
sujetos al a2 a3 d21=a2-al | d31=a3-al | d32= a3- a2 
sl 2 4 Ze 2 0 -2 
s2 4 7 15 3 11 8 
s3 8 13 19 5 11 6 
s4 7 9 15 2 8 6 
s5 6 15 89 9 83 74 
s6 5 10 14 5 9 4 
medias 5.333 9.667 25.667 4.333 20.333 16.000 
varianzas | 4.667 | 15.867 | 995.867 7.067 959.067 819.200 


El cuadro 9.8 contiene las dos matrices de covarianza estimadas Sa y Sg que corresponden a los 
conjuntos A y B. Nótese que las varianzas del conjunto A son bastante similares (la razón entre la ma- 
yor y la menor es 121.867/95.867 = 1.3) y las covarianzas son mucho más pequeñas que las varianzas 
aunque bastante más dispares (la razón entre la mayor y la menor es 14.867/0.467 = 31.8). Sin em- 
bargo, en el conjunto B las varianzas son muy heterogéneas (la razón entre la mayor y la menor es 
995.867/4.667 = 213.4) pero las covarianzas son algo más homogéneas (la razón entre la mayor y la 
menor es 96.267/6.733=14.3). 
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CUADRO 9.8 
Matrices de covarianza de los conjuntos A y B 


Conjunto A Conjunto B 
121.867 14.867 13.267 4.667 6.733 20.733 


14.867 96.967 0.467 6.733 15.867 — 96.267 
13.267 0.467 95.867 20.733 96.267 995.867 


El conjunto A presenta circularidad o esfericidad casi perfecta. La prueba de Mauchly arroja un valor 
máximo y no resulta significativa (W, = 1.000, Y = .004; P = .998). Con su matriz de covarianzas pueden 
estimarse las varianzas de las diferencias entre niveles de tratamiento aplicando la ecuación 9.14: 


Sá = 121.867 + 96.967 — 2(14.867) = 189.100 
Sá = 121.867 + 95.867 — 2(13.267) = 191.200 
Sr, = 96.967 + 95.867 — 2(0.467) = 191.900 


Observe en primer lugar que las varianzas de las diferencias son exactamente los mismos valores que 
se calcularon directamente en el cuadro 9.6, y en segundo lugar que tales valores son aproximadamente 
iguales. La esfericidad se cumple cuando las varianzas de las diferencias entre niveles de tratamiento son 
iguales u homogéneas entre sí. Nótese además que mientras las varianzas de cada nivel del conjunto A 
calculadas en el cuadro 9.6 (121.867, 96.967 y 95.867) se representan en la diagonal principal de la matriz 
de covarianza del conjunto A, las varianzas de las diferencias entre niveles de tratamiento no tienen 
representación directa en la matriz de covarianza. Sin embargo, suelen asociarse con valores también 
homogéneos pero cercanos a cero para las covarianzas (en el conjunto A, 14.867, 13.267 y 0.467). La 
alta homogeneidad de las varianzas por un lado y de las covarianzas por otro conducirá también al 
cumplimiento del supuesto de simetría compuesta. 

Por el contrario, el conjunto B presenta una notable desviación de la esfericidad. La prueba de Mau- 
chly arroja un valor mínimo y es estadísticamente significativa (Wg = 0.005; de = 21.040, p = .000). La 
estimación de las varianzas de las diferencias entre niveles de tratamiento es: 


(2) 
Ñ 
l 


4.667 + 15.867 — 2(6.733) = 7.067 
Sa 4.667 + 995.867 — 2(20.733) = 959.068 
15.867 + 995.867 — 2(96.267) = 819.200 


a 
w 
1 


(2) 
Ñ 
l 


que son iguales a los valores de varianzas de las diferencias obtenidas directamente en el cuadro 9.7. Nó- 
tese nuevamente que los elementos diagonales y los elementos no diagonales de la matriz de covarianza 
son muy heterogéneos, como también lo son las varianzas de las diferencias entre niveles de tratamien- 
to. Sin embargo, no hay representación directa de las varianzas de las diferencias entre niveles sobre la 
matriz de covarianza, aunque se asocian en la matriz de covarianzas con valores muy heterogéneos y 
alejados de cero para las covarianzas. La desviación de la esfericidad es máxima cuando las varianzas 
de las diferencias entre niveles de tratamiento son altamente heterogéneas entre sí y será tanto mayor 
la desviación de la esfericidad cuanto más heterogéneas sean. 


9.3.4. El enfoque multivariante (MANOVA) 


El enfoque univariante para analizar los datos de un DMR presenta serios problemas interpretativos 
cuando se incumple el supuesto de esfericidad o el más estricto supuesto de simetría compuesta. Ade- 
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más, con la representación univariante no es posible comprobar el supuesto de esfericidad ni obtener 
muchos de los resultados que hemos comentado en la sección anterior. 

En cambio una representación multivariante nos permite un análisis más pormenorizado de los 
datos del ejemplo 9.1. La matriz de covarianzas estimada es la siguiente: 


147.703 161.513 148.255 
S=| 161.513 190.565 164.922 
148.255 164.922 160.471 


donde puede constatarse que existe homogeneidad de las varianzas (la razón entre la mayor y la menor 
es 190.565/147.703 = 1.3) y de las covarianzas (la razón entre la mayor y la menor es 164.933/148.255 = 
1.1) y por tanto es previsible que se cumpla el supuesto de simetría compuesta, ya que las varianzas por 
un lado y las covarianzas por otro son homogéneas. Aplicando la ecuación 9.14 obtenemos 


Sá =  147.703+190.565-— 2(161.513) = 15.242 
Sha =  147.703+160.471-— 2(148.255) = 11.664 
Sto, =  190.565+ 160.471 -— 2(164.922) = 21.192 


y comprobamos en efecto que las varianzas de las diferencias son homogéneas y cercanas a cero. En 
consecuencia, cabe afirmar para los datos del ejemplo 9.1 que se cumple también el supuesto de esfe- 
ricidad. Esta conclusión ya nos permitiría dar por válidos los resultados que obtuvimos con el enfoque 
univariante clásico. 

El enfoque multivariante utiliza la representación multivariante del cuadro 9.2 y se fundamenta en 
la extensión multivariante del modelo lineal clásico que, para el caso de un factor intrasujetos con a 
niveles de tratamiento, consiste en reemplazar la media 4; por un vector de medias para los a niveles del 
factor intrasujetos 4 = (U7,..., 4 ee La) y la varianza e por la matriz de covarianzas 2 (ecuación 9.7). 
El único supuesto que requiere es que las observaciones sigan una distribución normal multivariante 
NM(p, 2). Para el DMR, el enfoque multivariante concierne únicamente al componente intrasujetos y 
se limita a utilizar ANÁLISIS DE VARIANZA MULTIVARIANTE (MANOVA), que consiste en probar la hipótesis 
nula de igualdad de las medias del factor intrasujeto Hp : 4= (u] =...= La)”. Para el ejemplo 9.1, el vector 
de medias que estima pu es Y; = (70.06, 66.28, 66.67)”. 

Para probar la hipótesis de igualdad de medias en el caso univariante utilizamos pruebas F que 
comparan varianzas. Pero no existe una prueba F para el caso multivariante que compare matrices de 
covarianza. En su lugar se emplean alguno/s de varios CRITERIOS ESTADÍSTICOS MULTIVARIANTES, cuyas 
distribuciones no pueden calcularse, pero un estadístico F equivalente puede obtenerse de forma exacta 
con gl; = a— 1 y gl, = n- a+ 1. Los criterios estadísticos multivariantes más importantes son, como 
tratamos en la sección 3.6, lambda de Wilks, traza de Pillai, traza de Hotelling-Lawley y el criterio de 
la raíz mayor de Roy. La primera parte de la salida 9.4 presenta los cuatro criterios, produciendo una 
prueba F exacta con a— 1 grados de libertad para el numerador y n-— a+ 1 grados de libertad para el 
denominador, F(2, 16) = 13.402; p = .000, que permite rechazar la hipótesis nula de igualdad de medias 
entre grupos con cualquiera de los criterios. Recuérdese que las pruebas multivariantes no requieren el 
cumplimiento del supuesto de esfericidad. 

Muchos programas estadísticos ofrecen la salida del enfoque multivariante separada en varias por- 
ciones: los criterios multivariantes, la prueba de esfericidad y los factores de corrección e y el análisis 
de varianza para el factor o factores intrasujeto. Un resumen de la información esencial ofrecida por el 
programa SPSS con el enfoque multivariante se muestra en la salida 9.4. 
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SALIDA 9.4 
Enfoque multivariante para un DMR con un factor intrasujeto (ejemplo 9.1) 


Criterios multivariantes 


Efecto Criterio Valor F gl glo P>F 
contextos Traza de Pillai 0.626 | 13.402 2 16 .000 
Lambda de Wilks 0.374 | 13.402 2 16 .000 
Traza de Hotelling 1.675 | 13.402 2 16 .000 
Raíz mayor de Roy 1.675 | 13.402 2 16 .000 
Prueba de Mauchly e índices de ajuste epsilon 
Efecto W de Mauchly e gl P>x? GG HF 
contextos 0.880 2.049 2 .359 | 0.893 0.990 
ANOVA efectos intrasujeto DMR 

Fuente Índice SC tipo HI gl MC F P>F 
contextos | Asumiendo esfericidad 155.444 2 | 77.722 | 9.695 .000 
Greenhouse-Geisser 155.444 1.785 | 87.064 | 9.695 .001 
Huynh-Feldt 155.444 1.981 78.475 | 9.695 .001 

Residual | Asumiendo esfericidad 272.556 34 8.016 

Greenhouse-Geisser 272.556 | 30.352 8.980 

Huynh-Feldt 272.556 | 33.674 8.094 


En primer lugar, todos los criterios multivariantes (de los que los más usuales son la traza de Pillai 
y la lambda de Wilks) resultan significativos. En segundo lugar, la prueba W de Mauchly no es signi- 
ficativa 06 = 2.049; p = .359), y por tanto se verifica el cumplimiento del supuesto de esfericidad para 
los datos del ejemplo 9.1. En tercer lugar, los índices correctores de los grados de libertad propuestos 
por Greenhouse y Geisser (criterio GG, ecuación 9.18) y Huynh y Feldt (criterio HF, ecuación 9.19) se 
utilizan en la última parte de la salida 9.3. Puesto que se cumple el supuesto de esfericidad, se puede uti- 
lizar la primera línea para interpretar el efecto. Si no se hubiera verificado el supuesto, la primera línea 
no sería interpretable y en su lugar deben interpretarse la segunda o la tercera en función del criterio 
que el investigador considere más conveniente. Por ejemplo, aplicando la ecuación 9.18, el índice de co- 
rrección £c6 de Greenhouse-Geisser, siendo la media de todos los elementos de la matriz de covarianza 
S = 160.9018, la media de los elementos diagonales Si¡ = 166.2455, las medias de fila S; = 152.4902, 
So =172.3327 y S3 = 157.8824, la suma de los cuadrados de todos los elementos Y Si; = 234411.5429 y la 


—2 
suma cuadrática de las medias de fila S; = 77878.6728, resulta 


Ñ (33) (166.2455 — 160.9018)? 
— (2)(234411.5429) — (21(77878.6728) + (32)(160.9018?) 


El índice gcc se utiliza en la última parte de la salida 9.4 para corregir los grados de libertad en el caso de 
violación del supuesto de esfericidad. Obsérvese que los grados de libertad corregidos con el procedi- 
miento de Greenhouse y Geisser son (2)(0.893) = 1.785 para el numerador y (34) (0.893) = 30.352 para el 
denominador. Y similarmente, los grados de libertad corregidos con el procedimiento de Huynh-Feldt 
son (.99)(2) = 1.981 para el numerador y (.99)(34) = 33.674 para el denominador. Todo el interés no re- 
side como es usual en el resultado de la prueba F, que como se desprende de la salida 9.4 es el mismo 
para todos los criterios, sino en el valor de probabilidad que lleva asociado y que depende de los gra- 
dos de libertad corregidos para numerador y denominador. Para los datos del ejemplo, puesto que se 


= 0.893 


EGG 
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verifica el supuesto de esfericidad, la prueba del efecto de contextos sería F4(2,34) = 9.695; p < .001. Sin 
embargo, si el investigador decidiera utilizar el criterio de Huynh-Feldt por considerar que existe alguna 
desviación del supuesto de esfericidad, el reporte sería F4(1.981,33.674) = 9.695; p = .001. 

Una ventaja importante del enfoque multivariante es que solamente requiere el cumplimiento de 
uno de los supuestos del ANOVA clásico, a saber, el supuesto de normalidad, pero no requiere el cumpli- 
miento de la homoscedasticidad e independencia de las observaciones ni tampoco el supuesto de esfe- 
ricidad del ANOVA de un factor intrasujeto. Esta ventaja justifica la popularidad que ha tenido en las dos 
últimas décadas, y que actualmente todavía mantiene. Sin embargo, el enfoque multivariante también 
asume una estructura de covarianza, la matriz de covarianza no estructurada. Para el caso del ejemplo 
9.1, la matriz de covarianzas NE, que se estimó más arriba, requiere la estimación de [(a)(a— 1)]/2=6 
parámetros, a saber las varianzas (0%, 0 y 03) de la diagonal principal y las covarianzas (012, 013 y 023), 
del triángulo superior (o inferior) de la matriz. La necesidad de estimar todos los parámetros de la ma- 
triz de covarianza en el enfoque multivariante hace este enfoque poco parsimonioso, en comparación 
con el número de parámetros que requiere estimar el enfoque univariante clásico. Esta es la razón por 
la que el enfoque multivariante tampoco se considera un enfoque satisfactorio. 


9.3.5. El enfoque mixto 


El enfoque mixto es el más general de todos los procedimientos para el análisis del DMR. El punto 
de partida es una ampliación de la ya conocida ecuación del modelo lineal clásico (LM) 


Y, = Bo+) P¡Xj+ ei (9.20) 
7 


y expresada de forma matricial 


Y=XfP+e (9.21) 


donde y es un vector n x 1 de observaciones en la variable de respuesta, X es una matriz conocida que 
contiene los efectos fijos del modelo, con una columna para la intercepción y p columnas para variables 
numéricas y/o variables categóricas codificadas, f es un vector de parámetros q x 1 de efectos fijos, don- 
de q = p+ 1, y ees un vector de errores residuales que se suponen con varianza constante y distribuidos 
normal e independientemente, NID(O, 07D. 

Las ecuaciones 9.20 y 9.21 son expresiones matemáticas de modelos de la estructura LM. En estas 
ecuaciones sólo pueden incluirse efectos fijos y su objetivo es el modelado de las medias de tratamiento 
para uno o más factores intersujetos. Una generalización de la ecuación 9.21 formula la estructura LMM 
que permite la especificación de cualquier combinación de efectos fijos y aleatorios, a saber: 


Y=XP+Zu+e (9.22) 


donde Z es una matriz conocida que contiene los efectos aleatorios del modelo, u es un vector de pará- 
metros de efectos aleatorios y e es un vector de errores aleatorios cuyos elementos no se asume necesa 
riamente que sean independientes ni su varianza constante. 
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La ecuación 9.22 no sólo permite la inclusión de efectos aleatorios sino también el modelado de 
matrices de covarianza, ya que el vector de efectos aleatorios u se supone distribuido según NID(0,G) 
y el vector de errores e se supone distribuido según NID(0,R), donde G y R son matrices de covarianza. 
La matriz G se emplea básicamente para modelar matrices de covarianza cuando se incluyen factores 
aleatorios intersujetos mientras que la matriz R se emplea para modelar matrices de covarianza con 
factores intrasujeto. Siendo la varianza del vector de observaciones Y 


Y» =ZGZ'+R (9.23) 


entonces cuando Z=0 (o sea, no hay efectos aleatorios) y R = 0?1 se cumple la ecuación 9.21 (modelo 
lineal clásico), que se formula para modelos de efectos fijos, pero cuando ZA 0 (o sea, hay efectos alea- 
torios), o RX a?l, entonces se cumple la ecuación 9.22 (modelo lineal mixto). La ecuación general 9.22 
permite por tanto incorporar a un modelo efectos aleatorios intersujetos (como se trató en el capítulo 4) 
y efectos repetidos intrasujetos. Para ello, el investigador tiene que especificar una matriz G de efectos 
aleatorios y/o una matriz R de errores residuales. 

La ventaja del enfoque mixto es que pueden reproducirse los resultados del enfoque univariante clá- 
sico y del enfoque multivariante con diseños DMR mediante la especificación de una matriz R diferente 
para cada caso. El enfoque mixto es mucho más potente y más flexible porque no sólo permite modelar 
medias de grupo (como en el enfoque univariante clásico) sino también estructuras de covarianza. 

Su desventaja principal ha sido hasta ahora su complejidad de cálculo. En comparación con el en- 
foque univariante clásico, que utiliza mínimos cuadrados ordinarios (OLS) para estimar los parámetros 
de un modelo y pueden obtenerse con una simple calculadora de escritorio, el enfoque mixto emplea 
estimación por máxima verosimilitud (ML) o máxima verosimilitud restringida (REML) para estimar 
los parámetros de efectos fijos o aleatorios. Afortunadamente todos los paquetes estadísticos profesio- 
nales (entre ellos, GENSTAT, R, SAS, SPSS y STATA) ya han incorporando a su repertorio de programas 
excelentes rutinas para familiarizar a los usuarios con el enfoque mixto. 

Por ejemplo, si se deseara modelar una estructura de simetría compuesta y probar el efecto del factor 
fijo intrasujetos contextos, los resultados del enfoque mixto obtenidos con el programa SPSS se resumen 
en la salida 9.5. 


SALIDA 9.5 
Enfoque mixto del DMR con un factor intrasujeto y matriz SC 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Simetría compuesta -164.612 329.223 (5) 333.223 337.087 
Efectos aleatorios 
Parámetros Estimador E. típico Zde Wald | P>|z| 
Covarianza SC 158.230 55.193 2.867 .004 
Varianza SC 8.016 1.944 4.123 .000 
Efectos fijos 
Fuentes de variación £lnum 8lden F P>F 
contextos 2 34 9.695 .000 


Es importante tener en cuenta algunas precisiones para facilitar la interpretación de los resultados 
del enfoque mixto de la salida 9.5: 
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— La primera parte de la salida 9.5 es un resumen de un modelo donde se especifica la estructura 
de covarianza seleccionada (matriz SC), la función de verosimilitud restringida (LogLik o LL), la 
desvianza, que es igual a -2x LL, el número de parámetros (q) empleado y los criterios AC y BIC 
redefinidos (véanse ecuaciones 1.10 y 1.11) para ayudar al investigador a decidir entre modelos: 


AIC =  Desvianza+ (2)(qgA) (9.24) 
BIC = Desvianza+In(N-— GEF) x GEA (9.25) 


donde N es el número total de observaciones, In es el logaritmo natural, qg4 es el número de 
parámetros de efectos aleatorios y qgf es el número de parámetros de efectos fijos que el modelo 
precisa estimar. En el ejemplo 9.1, qza = 2 (en la segunda parte de la salida se etiquetan como 'Va- 
rianza SC, para referirse a los elementos de la diagonal principal y 'Covarianza SC”, para referirse 
a los elementos no pertenecientes a la diagonal principal) y q£f = 3, de los que uno corresponde 
a la constante (que no se representa en la salida porque no suele ser objeto de interpretación) y 
dos para los efectos del factor contextos. En general, cuanto menor sea la magnitud de los índices 
mejor es el ajuste del modelo. 


— La segunda parte de la salida 9.5 reporta los efectos aleatorios y los parámetros de covarianza. El 
modelo no tiene factores aleatorios, pero sí tiene efectos intrasujeto cuyos parámetros son alea- 
torios y se modelan con la matriz de covarianzas SC, que consta de dos parámetros diferentes: 
el etiquetado como "Varianza SC' estima o? y es igual para todos los niveles del factor intrasujeto 
(o sea, asume homogeneidad de varianzas), siendo su estimador se = 8.016. El etiquetado como 
"Covarianza SC” estima 0% y es también igual para todos los pares de niveles del factor intrasujeto 
(o sea, asume homogeneidad de covarianzas), siendo su estimador s? = 158.230. La correlación 
intraclase se obtiene dividiendo el parámetro de covarianza entre la suma de los parámetros de 
covarianza y varianza: R¡ = 158.230/(158.230 + 8.016) = 0.952. La estimación de la matriz de cova- 
rianza de simetría compuesta es, para cada sujeto, 


166.246 158.230 158.230 1 0.952 0.952 
S()=| 158.230 166.246 158.230 |=166.246| 0.952 1 0.952 
158.230 158.230 166.246 0.952 0.952 1 


— La tercera parte de la salida 9.5 reproduce los efectos fijos del modelo, que utiliza un total de qgf = 
3 parámetros. Excluyendo la constante, que por lo general no tiene relevancia analítica, la prueba 
del efecto fijo del factor contextos produce un resultado significativo: F(2,34) = 9.695; P < .001l, 
que es exactamente el mismo resultado que se obtuvo en la salida 9.3 con el enfoque univariante 
clásico y en la salida 9.4 asumiendo esfericidad. 


Pero el objeto del enfoque mixto es encontrar el modelo con mejor ajuste. Aunque el enfoque mul- 
tivariante ha permitido constatar que el modelo con simetría compuesta es aceptable, el enfoque mixto 
permite operar, una vez seleccionado un modelo determinado, postulando otras matrices de covarianza 
y comparando el ajuste obtenido entre dos modelos diferentes mediante la estrategia de comparación 
de modelos. Ilustramos a continuación las potencialidades del enfoque mixto especificando una matriz 
de covarianza no estructurada en lugar de una matriz de simetría compuesta. Los resultados se resumen 
en la salida 9.6. 
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SALIDA 9.6 
Enfoque mixto del DMR con un factor intrasujeto y matriz NE 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
No estructurada 162.020 324.039 (9) 336.039 347.630 
Efectos aleatorios 
Parámetros Estimador E. típico Zde Wald | P>|zl 
Varianza NE(1, 1) 147.703 50.663 2.915 .004 
Varianza NE(2,2) 190.563 65.363 2.915 .004 
Varianza NE(3, 3) 160.471 55.041 2.915 .004 
Covarianza NE(2, 1) 161.513 56.482 2.860 .004 
Covarianza NE(3, 1) 148.255 51.838 2.860 .004 
Covarianza NE(3,2) 164.922 58.299 2.829 .005 
Efectos fijos 
Fuentes de variación 8 lnum 8lden F P>F 
contextos 2 17 14.240 .000 


— En primer lugar, obsérvese que los estadísticos AIC y BIC de la salida 9.6 son mayores que los 
de la salida 9.5, y por tanto este modelo representa peor ajuste que el anterior. Sin embargo, la 
desvianza resulta algo menor, lo cual es lógico porque la magnitud de la desvianza depende del 
número de parámetros del modelo y será menor cuanto mayor sea el número de parámetros usa- 
do. Como aproximación, a primera vista parece que el modelo con matriz NE no es mejor que el 
modelo con matriz SC. El número de parámetros que se emplean en este modelo son q = 9 en 
total, de los que q£f = 3 son efectos fijos (uno para la constante y dos para el factor) y qa = 6 son 
efectos aleatorios (que son los parámetros de la matriz de covarianzas NE). 


— En segundo lugar, la matriz de covarianzas no estructurada utiliza 6 parámetros distintos, 3 va- 
rianzas para la diagonal principal y 3 covarianzas para el triángulo superior (o inferior, puesto 
que las matrices de covarianza son siempre simétricas) de la matriz. Los estimadores de los pa- 
rámetros son exactamente las varianzas y covarianzas empíricas que se obtuvieron en el análisis 
descriptivo (véase salida 9.1). Las correlaciones intraclase se obtienen dividiendo cada covarianza 
por la raíz cuadrada del producto de sus respectivas varianzas y apuntan que varianzas y cova- 
rianzas son homogéneas. 


— En tercer lugar, nótese que la salida ANOVA para los efectos fijos del modelo prescinde de la cons- 
tante. El efecto del factor contextos del modelo con matriz NE resulta también estadísticamente 
significativo: F(2,17) = 14.240, P < .001, pero el resultado difiere del obtenido con la matriz SC. Es- 
ta prueba es formalmente equivalente a la F del enfoque multivariante de la salida 9.4, aunque el 
resultado no es exactamente el mismo: F(2, 16) = 13.402; P < .001 como consecuencia de emplear 
representaciones diferentes de los datos empíricos. 


La estrategia de ajuste condicional puede ser utilizada en este contexto para comparar los mode- 
los ajustados en las salidas 9.5 y 9.6. El enfoque mixto utiliza estimación ML o REML y distribución 
1 y por ello es algo diferente de la salida del ajuste condicional empleada con estimación OLS y dis- 
tribución F. El proceso de ajuste es no obstante muy similar: se calcula la diferencia absoluta entre las 
desvianzas de los dos modelos ajustados y la diferencia en el número de parámetros y con el resultado 
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se consulta directamente la distribución x?. La salida 9.7 resume los resultados de la prueba condicio- 
nal obteniendo AD = [329.233 — 324.039] = 5.194 con Agl = |5-— 9] = 4. El valor de probabilidad de una 
distribución y? para esta diferencia en desvianza y grados de libertad no es estadísticamente signifi- 
cativo: e (4) = 5.194; P = .268. En consecuencia, ambos modelos no difieren significativamente y por 
tanto puede tomarse el modelo más simple (o sea, el modelo con matriz de covarianza SC) como una 
explicación más adecuada de los datos empíricos. 


SALIDA 9.7 
Ajuste condicional de los modelos SC y NE del DMR con un factor intrasujetos 


Modelo 1: DMR simple con matriz SC 
Modelo 2: DMR simple con matriz NE 


Modelo | Desvianza 


329.233 
324.039 


A diferencia de los otros dos enfoques alternativos (enfoques univariante clásico y multivariante), la 
flexibilidad del enfoque mixto reside en posibilitar la especificación de diferentes matrices de covarian- 
za para asegurar la búsqueda del mejor modelo que explique los datos empíricos con el menor número 
de parámetros posible. Para el ejemplo 9.1 que hemos tratado hasta aquí, nos permite deducir que asu- 
miendo un modelo con matriz de covarianzas de simetría compuesta se obtiene mejor ajuste que si se 
asume un modelo con matriz de covarianzas no estructurada. Por esta razón, una estrategia apropiada 
para proceder con esta metodología consiste en estimar los efectos del modelo especificando primero 
una matriz de covarianza no estructurada, que es la más compleja por el número de parámetros que 
requiere, y proceder después con matrices más parsimoniosas hasta encontrar la más simple matriz de 
covarianzas que represente adecuadamente los datos empíricos. 


9.4. DMR CON DOS FACTORES INTRASUJETO 


El diseño de medidas totalmente repetidas con un factor puede generalizarse a cualquier número 
de factores intrasujeto. El resultado es el DMR FACTORIAL, que a todos los efectos es estructuralmente 
equivalente al DBA factorial, donde los bloques se sustituyen por sujetos. Pero es importante recalcar 
que, para que el diseño tenga condición de experimental, al menos uno de los factores de tratamiento 
tiene que ser aleatorizado. 

La descomposición de la SC Total de este diseño se compara con la del DCA equivalente en la figura 
9.5. Respecto del DCA : ax b con dos factores intersujeto, que tiene 4 fuentes de variación, el DMR: 
[ax b] con dos factores intrasujeto tiene 7, que se reducen finalmente a 5, porque se asumen igual a cero 
las interacciones entre componentes de las estructuras de tratamiento y control (A x S y B x S). Nótese 
que la estructura de tratamientos factorial es cruzada, como en el DCA y en el DBA factoriales, pero 
en este caso los efectos factoriales son intrasujeto y no intersujetos. Además, el componente de error 
residual S(AB) del DCA factorial se descompone en el DMR factorial en un componente intersujetos 
por un lado (S, con n— 1 grados de libertad) y tres componentes intrasujeto (4S, BS y ABS), que se 
subsumen en el término Residual, con (ab—1)(n—1) grados de libertad. La estructura de error es múltiple 
porque se consideran dos diferentes entidades de unidad experimental: la más grande corresponde a 
diferencias individuales entre sujetos (componente residual intersujetos S, de nivel 2) y la más pequeña 
corresponde a diferencias entre las medidas repetidas (componente residual intrasujeto, de nivel 1). 
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DCA DMR 


Componente 
B=———=> B > intersujetos 


Total AB »AB 
AOSIgna! Componente 
S(AB) intrasujetos 
S 


Figura 9.5. — Partición de la variación en el DMR con dos factores intrasujeto. 


Ilustramos este diseño con el ejemplo 9.2, que se refiere a un estudio sobre memoria en el que se 
registró el número de aciertos en una tarea de aprendizaje obtenido con una muestra aleatoria de 7 par- 
ticipantes (variable S, 'Sujetos”), quienes realizaron dos tareas de memoria (factor A, con niveles, al: re- 
conocimiento y a2: recuerdo) registradas en 3 diferentes intervalostemporales (factor B, con niveles, b1: 
más de una hora, b2: más de un día y b3: más de una semana). Cada uno de los participantes recibieron 
los niveles del factor tareas siguiendo un orden determinado mediante contraequilibración aleatoria. 
Este diseño combina por tanto una estructura de tratamientos con dos factores (A y B) y una estructura 
de control mediante bloqueo intrasujeto con una variable de sujeto (S). Los dos factores (A y B) son del 
tipo intrasujetos, porque cada uno de los participantes recibe todas las 2 x 3 = 6 combinaciones de tra- 
tamiento. Es un diseño experimental porque la administración de los niveles de tratamiento del factor 
A fue aleatoria para cada sujeto participante. La notación del diseño resultante es DMR:[2x 3],n=7. 

El cuadro 9.9 muestra la representación multivariante, donde las filas son sujetos y las columnas 
son las a x b combinaciones de tratamiento, lo que supone un total de 7 x 2 x 3 = 42 observaciones. El 
cuadro 9.10 muestra la representación univariante para los participantes 1 y 7, donde cada una de las 42 
observaciones ocupa una fila y las columnas son las tres variables implicadas. 


CUADRO 9.9 
Representación multivariante del ejemplo 9.2 


reconocimiento recuerdo 
sujetos | bl1(>1h.) | b2(> 1d.) | b3(> 15.) | bl(>1h.) | b2(> 1d.) | b3(> 1s.) 
1 5 
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sujetos 


intervalos 


CUADRO 9.10 
Representación univariante abreviada del ejemplo 9.2 


aciertos 


sujetos 


intervalos | aciertos 


1 


b1 
b2 


b3 
b1 
b2 
b3 


4 


7 


b1 
b2 
b3 
b1 
b2 
b3 


Por su parte, la figura 9.6 presenta un gráfico de perfil de las medias de los factores de este diseño. 


aciertos 
[e] 
t 


intervalos 


tareas 
0 al 
má 22 


Figura 9.6. — Gráfico de medias del ejemplo 9.2. 


Un análisis descriptivo de todas las variables implicadas se muestra en la salida 9.8. Para realizar el 
cálculo de las cantidades básicas y las SC necesitamos disponer por separado de las tablas correspon- 
dientes a la interacción de primer orden tareas x intervalos y del pseudofactor de sujetos. 
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SALIDA 9.8a 
Análisis descriptivo ejemplo 9.2 - Estructura de los tratamientos 


Variable dependiente: aciertos 


intervalos Varianza 
bl 3.905 
b2 3.810 
b3 6.000 
10.514 
bl 2.238 
b2 2.238 


b3 2.619 
5.000 
b1 2.923 
b2 4.027 
b3 5.566 
8.321 


SALIDA 9.8b 
Análisis descriptivo ejemplo 9.2 - Estructura del control 
Variable dependiente: aciertos 
sujetos 
sl 
s2 
s3 
sú 
s5 
s6 
s7 


9.4.1. Elenfoque univariante 


Puesto que hay dos factores intrasujeto, tareas (4) e intervalos (B) y un pseudofactor de sujetos (S), el 
modelo completo para analizar los datos del ejemplo 9.2 es ANOVA de tres factores con una observación 
por combinación de niveles de factor: 


Yi je = M4 5S¡+ 054 PH (06) jr + (sa); + (SP) ir + ij (9.26) 


donde el (pseudo)factor S asume efectos aleatorios y los factores A y B asumen efectos fijos. Sin em- 
bargo, en el modelo de la ecuación 9.26 todas las interacciones del pseudofactor S con los factores de 
tratamiento son términos que violan el principio de no interacción entre estructura de tratamiento y 
estructura de control. Es más parsimonioso, y más fácilmente interpretable desde una perspectiva sus- 
tantiva, condensar todos los términos residuales en un término único. El modelo resultante es 


Vije=p4+S¡+0j7+ Br+l(a6) jr + jjk (9.27) 
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donde el término residual e; subsume todos los componentes interactivos que afectan al pseufac- 
tor de Sujetos. La estructura de los tratamientos es y +aj¡+ Pz + (06) jx, la estructura de control es s; 
y los componentes s; y ej; representan una estructura múltiple de error, con s; (diferencias intersu- 
jetos, componente de nivel 2) y e; jk (diferencias intrasujetos, componente de nivel 1). El modelo de la 
ecuación 9.27 cumple por tanto con la condición de independencia entre estructura de tratamientos 
y estructura de control. Las fuentes de variación, los grados de libertad y las esperanzas de las medias 
cuadráticas suponiendo A y B fijos se representan en el cuadro 9.11. 


CUADRO 9.11 


Esperanzas y razones F del DMR: [(2x 3],n=7 


Fuente 


Grados libertad 


Razón F 


Residual 


(a—1) 
(=D) 


(a- D(b-1) 


A/Residual 
B/Residual 


AB/Residual 


(n-1) 
(ab-1D)(n-1) 


Total 


abn-1 


Para desarrollar el análisis de varianza, los cálculos implicados emplean la representación univa- 
riante (cuadro 9.10), se obtienen a partir del análisis descriptivo de la salida 9.8, y se han resumido en el 


cuadro 9.12. 


CUADRO 9.12 


Cálculo de las SC del DMR: [2 x 3],n =7 ANOVA 2 factores intrasujeto 


Cantidades básicas Procedimiento de cálculo No términos 
0] =72/abn (246)? /42 = 1440.857 1 
[S]=E S?/ab (26)?/6+...+(43)2/6= 1501.667 n=7 
[A] =Y A7/bn (140)2/21+ (105)2/21 =1471.714 a=2 
[B] = E Bé/an (4232/14+...+(109)2/14=1619.286 b=3 
[AB] =ED ABS, /n 2392/7+...+(46)2/7=1657.143 ab=6 
[R]=N F(n- DS (6)(3.905 +... +5.566) = 124.857 (n- Dab=36 
Sumas de cuadrados Procedimiento de cálculo Grados de libertad 
SCs=[S] - [1] 1501.667 — 1440.857 = 60.810 6 
SCA=[4]- [1] 1471.714—1440.857 = 30.857 1 
SCg =[B]-[1] 1619.286 — 1440.857 = 178.429 2 
SCag = [AB] -[4)-1[B]+ [1] 1657.143—...+1440.857 =7.000 2 
SCr =[R] - (1S] — [1)) 124.857 — (1501.667 — 1440.857) = 64.048 | 30 
SCm=SCs+SCA+SCB+SCaAB | 60.810+ 30.857 + 178.429 +7=277.096 11 
SCT =SCm+SCr 277.096+ 64.048 = 341.144 41 


Se requiere ante todo comprobar que el modelo no incumple el supuesto de independencia entre 
estructuras, para cuya finalidad se aplica la prueba de aditividad de Tukey. Con diseños factoriales, la 
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prueba de aditividad se aplica de forma independiente para cada factor para determinar si un compo- 
nente interactivo es significativo. Hay una prueba de aditividad con el factor A para evaluar si la interac- 
ción A x S es significativa, y otra prueba de aditividad con el factor B para evaluar si la interacción B x S 
es significativa. Los correspondientes componentes de no aditividad no fueron significativos ni para ta- 
reas, Fy a,a(1,33) = 0.123; P = .728, ni para intervalos, Fy a, 8 (1,32) = 0.594, P =.447. En consecuencia, se 
verifica el supuesto de independencia entre estructuras. 

Por otra parte, los resultados del ajuste del modelo interactivo de la ecuación 9.27 (salida 9.9) apun- 
tan que el término de interacción A x B no es significativo, F(2,30) = 1.639; P =.211, y por tanto es re- 
comendable prescindir del efecto de interacción Ax B y ajustar un modelo aditivo, lo que incrementará 
en (a— 1)(b-— 1) = 2 grados de libertad el componente de error residual para probar los efectos facto- 
riales del modelo resultante. La salida 9.10 muestra el ANOVA para el modelo aditivo, donde se apun- 
ta un buen ajuste global: F(9,32) = 13.519; P < .001, y efectos significativos tanto para el factor tareas: 
F(1,32) = 13.898; P = .001, como para el factor intervalos: F(2,32) = 40.182;P < .001. Sin embargo, el 
problema esencial es que la salida univariante sólo es interpretable si se cumple el supuesto de simetría 
compuesta, un supuesto que no es posible probar desde el enfoque univariante. 


SALIDA 9.9 
ANOVA para el modelo interactivo del DMR: [2 x3],n=7 


Variable dependiente: aciertos 


Fuente SC tipoIll1 | gl MC F P>F 
Modelo 277.096 11 | 25.191 11.799 .000 
Intersujetos 

sujetos 60.810 6 | 10.135 
Intrasujetos 
tareas (A) 30.857 30.857 | 14.454% .001 
intervalos (B) 178.429 89.214 | 41.788% .000 
tareas x intervalos 7.000 3.500 1.6391 .211 
Residual 64.048 | 30 2.135 
Total 341.143 | 41 


4NC Residual 


SALIDA 9.10 
ANOVA para el modelo aditivo del DMR: [2x3], n=7 
Variable dependiente: aciertos 
SC tipo HI 
270.095 


Fuente 
Modelo 


Intersujetos 
sujetos 


60.810 


Intrasujetos 
tareas (A) 


intervalos (B) 


30.857 
178.429 
71.048 
341.143 


Residual 
Total 
4MC Residual 
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9.4.2. El enfoque multivariante 


El enfoque multivariante utiliza la representación multivariante (cuadro 9.9) y afecta únicamente a 
los dos factores intrasujeto y a su interacción, o sea, a todas las fuentes de variación intrasujeto. Pero 
este enfoque no tiene en cuenta la estructura de error múltiple que caracteriza el enfoque univarian- 
te. Para analizar los datos del diseño intrasujeto DMR: [2 x 3], n = 7 mediante este enfoque, se utilizan 
criterios multivariantes (que no requieren cumplir el supuesto de esfericidad, aunque sí el de normali- 
dad multivariante), o índices de corrección de los grados de libertad basados en el grado de violación 
del supuesto de esfericidad. La salida 9.11 presenta los resultados para el modelo aditivo, puesto que la 
interacción A x B no fue significativa. 


SALIDA 9.11 
Enfoque multivariante para el modelo aditivo del DMR: [2 x 3],n=7 (ejemplo 9.2) 


Criterios multivariantes 


Efecto Criterio Valor F gl glo P>F 
tareas Traza de Pillai 0.568 7.886 1 6 .031 
Lambda de Wilks 0.432 7.886 gl 6 .031 
Traza de Hotelling 1.314 7.886 1 6 .031 
Raíz mayor de Roy 1.314 7.886 1 6 .031 
intervalos Traza de Pillai 0.888 19.743 2 5 .004 
Lambda de Wilks 0.112 19.743 2 5 .004 
Traza de Hotelling 7.897 19.743 2 5 .004 
Raíz mayor de Roy 7.897 19.743 2 5 .004 
Prueba de Mauchly e índices de ajuste epsilon 
Efecto W de Mauchly e gl P>x GG HF 
tareas 1.000 0.000 0 Ñ 1.000 1.000 
intervalos 0.590 2.638 2 .267 0.709 0.865 
ANOVA efectos intrasujeto DMR 
Fuente Índice SC tipo HI gl MC F P>F 
tareas Esfericidad asumida 30.857 1 30.857 7.886 .031 
Greenhouse-Geisser 30.857 1.000 30.857 7.886 .031 
Huynh-Feldt 30.857 1.000 30.857 7.886 .031 
Error(tareas) Esfericidad asumida 23.476 6 3.913 
Greenhouse-Geisser 23.476 6.000 3.913 
Huynh-Feldt 23.476 6.000 3.913 
intervalos Esfericidad asumida 178.429 2 89.214 | 37.038 .000 
Greenhouse-Geisser 178.429 1.419 125.785 | 37.038 .000 
Huynh-Feldt 178.429 1.731 103.090 | 37.038 .000 
Error(intervalos) | Esfericidad asumida 28.905 12 2.409 
Greenhouse-Geisser 28.905 8.511 3.396 
Huynh-Feldt 28.905 10.385 2.783 


En la primera parte de la salida 9.11, adoptando el nivel de significación del 5%, con cualquiera de los 
criterios estadísticos (por ejemplo, la traza de Pillai), puede concluirse que hay diferencias significativas 
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entre los niveles del factor tareas: F(1,6) = 7.886; P = .031 y del factor intervalos: F(2,5) = 19.743;P = 
.004. Recuérdese que estas pruebas no requieren el cumplimiento del supuesto de esfericidad. 

En la segunda parte de la salida del enfoque multivariante se aplica la prueba de Mauchly para de- 
terminar si el supuesto de esfericidad se ha violado. La prueba se aplica por separado a cada factor 
intrasujeto y emplea la distribución e con [a(a—1)/2]—1 grados de libertad, donde a se refiere alos ni- 
veles del factor. Observe que la prueba sólo puede aplicarse con factores que tienen más de dos niveles. 
Por esta razón, la salida 9.11 no aporta una prueba válida para el factor tareas. Para el factor intervalos, 
por el contrario, la prueba de Mauchly no arroja resultados significativos, ya que (2) = 2.638; P =.267, 
y por tanto se verifica el cumplimiento del supuesto de esfericidad. No obstante, se determina también 
el parámetro e, con los criterios de Greenhouse y Geisser y Huynh-Feldt, para corregir los grados de 
libertad de la razón F en el caso de que el supuesto resultara violado. 

La interpretación de la tercera parte de la salida depende de la decisión adoptada por el investigador 
en la segunda parte de la misma. Si decide asumir esfericidad, lo que se justificaría dado el resultado 
de la prueba de Mauchly, empleará solamente las líneas de la salida que especifican 'Esfericidad asu- 
mida', y concluirá que hay efectos significativos para tareas, F4(1,6) = 7.886; P =.031, y para intervalos, 
Fg(2, 12) = 37.03; P < .001. Pero también puede valorar que existe algún grado de violación del supuesto 
y utilizar los criterios para la corrección de los grados de libertad de numerador y denominador de cada 
razón F. Si decidiera por ejemplo emplear el criterio Huynh-Feldt, su interpretación concluirá también 
que hay efectos significativos para tareas: F4(1,6) = 7.886; P = .031 (o sea, el mismo resultado que asu- 
miendo esfericidad, ya que el parámetro e = 1) y para intervalos: Fy(1.731,10.385) = 37.038; P < .001. 
Nótese la discrepancia de esta parte de la salida 9.11 con la salida 9.10, motivada por el hecho de que el 
enfoque multivariante emplea términos de error diferentes para tareas y para intervalos, mientras que 
el enfoque univariante emplea un término de error común. 

Es importante advertir la representación de los efectos del modelo ANOVA con enfoque multivarian- 
te que presenta la salida 9.11, donde para cada fuente de variación se define un componente específico 
de error. Esta representación alternativa a la de la salida 9.10 es bastante popular en algunas áreas apli- 
cadas. En línea con esta representación, la salida univariante del modelo aditivo tendría un total de seis 
componentes: S, A con su error (A x S) y B con su error (B x S) mas un componente residual, y la salida 
del modelo no aditivo requeriría siete componentes: S, A, By AB con sus respectivos errores (Ax S, BxS 
y Ax B x S). Este último término sirve también como término residual, ya que se trata de un diseño no 
replicado. La salida 9.12 muestra los efectos del modelo aditivo con esta representación alternativa. 


SALIDA 9.12 
ANOVA alternativo para el modelo aditivo del DMR: [2x 3],n=7 


Variable dependiente: aciertos 
Fuente SC tipo IM F 
Modelo 322.476 13.519 
sujetos 60.809 
tareas 30.857 7.886 


Error (tareas) 23.476 
intervalos 178.429 2 37.0388 
Error (intervalos) 28.905 
Residual 18.667 
Total 341.143 
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Desde el enfoque de modelado que defendemos aquí no recomendamos el uso de esta represen- 
tación porque incumple el supuesto de no interacción entre sujetos y tratamientos y además porque 
los resultados no son equivalentes a los resultados de las salida s de los enfoques univariante y mixto. 
Utilizando el enfoque univariante y asumiendo el modelo aditivo, el ANOVA alternativo que se muestra 
en la salida 9.12 difiere sensiblemente respecto de la salida 9.10 y pueden producir inferencias diferen- 
tes, aunque conviene tener presente que esta representación se encuentra con relativa frecuencia en la 
literatura psicológica. Por otro lado, la reconversión de esta representación a la usual en los enfoques 
univariante y mixto es muy simple fundiendo todos los errores en un término único. 


9.4.3. El enfoque mixto 


Como tratamos en el ejemplo 9.1, la ventaja y la flexibilidad del enfoque mixto se debe a que permite 
modelar de forma independiente las medias (como los enfoques univariante y multivariante) y las va- 
rianzas. Una vez estimadas las medias, puede producir resultados diferentes en función de la estructura 
de covarianza que se asuma. Trataremos aquí los resultados obtenidos con dos diferentes estructuras de 
covarianza con el modelo aditivo del DMR con dos factores intrasujeto de la salida 9.10. Asumiremos 
en primer lugar la matriz de covarianza de simetría compuesta, que presupone que existen dos com- 
ponentes aleatorios en el modelo, la varianza de error o? y la varianza entresujetos 0?,. Puesto que las 
medidas repetidas afectan en su conjunto a la combinación factorial 2 x 3, la matriz de covarianzas SC 
es de dimensión 6 x 6 y su representación es, para cada sujeto i, la siguiente: 


0t+0% 0? 0? 0? 0? 0? 
2 2,52 2 2 2 2 
o eto as : dd os os 

es a a 0%+0% a a o (9.28) 
A 0? 0? 0? 0t+0? 0? o? " 

3 3 3 eee IS 2 3 
os os os os gos 5 , 
a a a a a 040% 


Lo que esta representación implica es que las varianzas son constantes para todos los niveles de tra- 
tamiento (homogeneidad de las varianzas) e iguales a 0? + 07, y que las covarianzas entre niveles de 
tratamiento son también constantes para todos los pares de niveles (homogeneidad de las covarianzas) 
e iguales a 0?. 

La salida 9.13 presenta primero un resumen general especificando la estructura de covarianza que se 
asume, el logaritmo de la función de verosimilitud estimada (LL), la desvianza y el número de paráme- 
tros (q) empleado, y los criterios A/C y BIC que pueden utilizarse de forma aproximada para comparar 
el ajuste del modelo con el de otros modelos alternativos con el objeto de determinar cuál de ellos es 
el más adecuado. A continuación se muestran los efectos aleatorios del modelo, que para la estructura 
asumida, la matriz de covarianzas SC, implica la estimación de los parámetros 0? y 07. Y finalmente se 
muestran los efectos fijos para un modelo aditivo (exceptuando la constante, que se ha omitido). Todo 
ello supone un total de 6 parámetros, de los cuales 2 son efectos aleatorios (los estimadores de varianza 
SC y covarianza SC) y 4 son efectos fijos (1 para la constante, 1 para el factor tareas y 2 para el factor in- 
tervalos). El ajuste global absoluto no es aceptable: y?(6) = 157.527; P < .001, pero los efectos para tareas: 
FA(1,32) = 13.898; P = .001, y para intervalos: Fg(2,32) = 40.182, P < .001 son estadísticamente significa- 
tivos. Compruébese que son exactamente iguales a los del enfoque univariante (salida 9.10), puesto que 
ambos enfoques asumen la misma matriz de covarianza. 
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SALIDA 9.13 
Enfoque mixto con matriz SC para modelo aditivo del DMR: [2x 3],n=7 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Simetría compuesta 78.764 157.527 (6) 161.527 164.803 
Efectos aleatorios 
Parámetros Estimador E. típico Zde Wald | P>|z| 
Covarianza SC 1.319 0.980 1.347 .178 
Varianza SC 2.200 0.555 4.000 .000 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 
tareas 1 32 13.898 .001 
intervalos 2 32 40.182 .000 


Una vez obtenidos los estimadores de los parámetros de la matriz de covarianza SC, la matriz esti- 
mada resultante, para cada sujeto ¡, es la siguiente: 


3.519 1.319 1.319 1.319 1.319 1.319 
1.319 3.519 1.319 1.319 1.319 1.319 
1.319 1.319 3.519 1.319 1.319 1.319 
1.319 1.3319 1.319 3.519 1.319 1.319 
1.319 1.319 1.319 1.3319 3.519 1.319 
1.319 1.319 1.319 1.3319 1.319 3.519 


El enfoque multivariante confirmó que se cumple el supuesto de simetría compuesta y por tanto la 
salida que habría que interpretar directamente es la salida 9.13. No obstante, con propósitos ilustrativos 
se presentan en la salida 9.14 los resultados del enfoque mixto asumiendo una matriz de covarianza NE. 
Nótese que esta matriz requiere estimar un total de [(ab)(ab+ 1D)1/2 = (6)(7)/2=21 parámetros. 

El formato de la salida 9.14 es similar a las restantes salida s del enfoque mixto. Se representa en la 
primera parte un resumen informativo del modelo ajustado, aportando la estructura de covarianza, el 
logaritmo de la función de verosimilitud (Loglik), la desvianza y el número de parámetros que requiere el 
modelo, y finalmente los criterios AIC y BIC. Observe en primer lugar que el ajuste global absoluto del 
modelo tampoco es aceptable, ya que se desvía demasiado del modelo saturado: x?(25) = 129.914; P < 
.001. En segundo lugar, el número de parámetros que se requieren suman en total q = 25, de los que 
21 corresponden a los parámetros aleatorios de la matriz de covarianzas NE y 4 a los efectos fijos del 
modelo (1 para la constante, 1 para el factor tareas y 2 para el factor intervalos). 

La segunda parte de la salida 9.14 presenta los 21 estimadores de la matriz de covarianzas NE. Nó- 
tese que tienen escaso interés en este contexto las pruebas z de Wald y sus probabilidades asociadas. 

La tercera parte de la salida 9.14 presenta los efectos fijos del modelo. Las pruebas F son formal- 
mente equivalentes (aunque no son exactamente iguales) al enfoque multivariante presentado ante- 
riormente (véase salida 9.11) debido al diferente formato de representación utilizada y al empleo de 
algoritmos numéricos iterativos. Aunque los resultados no deben ser objeto de interpretación hasta que 
el investigador decida qué modelo es mejor mediante ajuste condicional, las pruebas F reflejan efectos 
significativos tanto para tareas: F(1,6) = 6.51;P = .043, como para intervalos: F(2,6) = 18.63; P = .003. 
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Sin embargo, se observan diferencias importantes en los grados de libertad del denominador de los mo- 
delos con matrices SC y NE, ya que en el primero las razones F se prueban con 32, mientras que en el 
segundo se pruebas con 6 grados de libertad. 


salida 9.14 
Enfoque mixto con matriz NE para modelo aditivo del DMR:[2x3],n=7 

Estructura de covarianza Loglik Desvianza (q) AIC BIC 

Simetría compuesta 64.957 129.914 (25) 171.914 206.303 

Efectos aleatorios 

Parámetros Estimador E. típico Zde Wald | P>|zl 
NE(1,1) 4.432 3.152 1.401 .161 
NE(2,2) 4.532 3.102 1.461 .144 
NE(8,3) 7.068 5.178 1.365 .172 
NE(4,4) 2.241 1.325 1.692 .091 
NE(5,5) 2.345 1.513 1.550 .121 
NE(6,6) 2.630 1.558 1.688 .091 
NE(1,2) 0.402 1.981 0.203 .839 
NE(1,3) 1.250 2.552 0.490 .624 
NE(1,4) 1.157 1.500 0,771 .440 
NE(1,5) 0.359 1.571 0.228 .819 
NE(1,6) 0.361 1.591 0.227 .820 
NE(2,3) 5.080 3.882 1.309 .191 
NE(2,4) 1.379 1.706 0.808 .419 
NE(2,5) 0.863 1.743 0.495 .620 
NE(2,6) 2.371 2.037 1.164 .244 
NE(3,4) 0.646 1.953 0.331 .7141 
NE(38,5) 0.748 2.072 0.361 .118 
NE(3,6) 2.994 2.515 1.190 .234 
NE(4,5) 1.159 1.146 1.011 .312 
NE(4,6) 0.864 1.082 0.799 .425 
NE(5,6) 1.613 1.318 1.224 .221 

Efectos fijos 

Fuentes de variación £lnum 8lden F P>F 
tareas 1 6 6.506 .040 
intervalos 2 6 18.633 .003 


El investigador puede concluir, ante una inspección ocular de las salida s 9.13 y 9.14, que proba- 
blemente sea mejor el modelo con matriz SC que el modelo con matriz NE, ya que los criterios ATC 
y BIC son sensiblemente menores en el modelo con matriz SC que en el NE. Sin embargo, la prueba 
concluyente es el ajuste condicional de los dos modelos ajustados, que se representa en la salida 9.15. 
La diferencia absoluta en desvianzas es, en valores absolutos, de AD = 157.527— 129.914 = 27.613 y la di- 
ferencia absoluta en número de parámetros es de Aq =25-6= 19. Este resultado se evalúa mediante la 
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prueba de la razón de verosimilitud, que se distribuye según y? y sus grados de libertad son la diferencia 
entre el número de parámetros de ambos modelos: 19 = 27.613; P =.091, y por tanto se selecciona 
el modelo más simple (modelo con matriz de covarianzas SC), descartando el modelo más complejo 
(modelo con matriz de covarianzas NE), como el modelo que mejor explica los datos empíricos. 


SALIDA 9.15 
Ajuste condicional de los modelos SC y NE del DMR con un factor intrasujetos 


Modelo 1: DMR simple con matriz SC 
Modelo 2: DMR simple con matriz NE 


Desvianza 


157.527 
129.914 


9.5. ELENFOQUE GEE 


El ENFOQUE MIXTO fue desarrollado para tratar problemas de heterogeneidad e independencia con 
modelos de la estructura LMM y su generalización GLMM, que permiten combinar efectos fijos y alea- 
torios y se adaptan muy bien al análisis de datos longitudinales por modelar la estructura de covarianza 
y tratar óptimamente los valores perdidos. 

Un enfoque alternativo de características muy similares al enfoque mixto, que también se adapta 
bien al análisis de datos longitudinales, es el ENFOQUE GEE (Generalized Estimating Equations), que 
fue inicialmente propuesto por Liang y Zeger en 1986. Los modelos GEE pertenecen sin embargo a 
la estructura de los modelos lineales generalizados (GLM), utilizan también matrices de covarianza y 
regresión múltiple para estimar los parámetros, pero no pueden incluir efectos aleatorios. 

Los modelos GEE son más típicamente empleados con diseños de medidas repetidas no experi- 
mentales, como los diseños comparativos prospectivos, que tratamos en el capítulo 13, pero también es 
posible su empleo con diseños de medidas repetidas experimentales, siempre que se utilicen variables 
que admitan la aplicación de secuencias de equilibración aleatorias. 

Ventajas importantes de este tipo de modelos, además de admitir como variables de respuesta tanto 
variables numéricas como categóricas (binarias, ordinales, de recuento y de frecuencia), son su sen- 
cillez de aplicación, ya que son en realidad modelos de regresión adaptados para el análisis de datos 
agregados (clustered data), su reconocida eficiencia para el ajuste de modelos con datos longitudinales 
(véase Ballinger, 2004 y Gibbons, Hedeker y DuToit, 2010) y sus interesantes aplicaciones en diversos 
ámbitos de la investigación psicológica, y particularmente la Psicología Clínica (p. ej., Lopes et al., 2012) 
y la Psicología del Desarrollo (p. ej., Stupica, Sherman y Cassidy, 2011). 


9.6. EJEMPLOS PUBLICADOS CON DMR INTRASUJETOS 


De todos los diseños experimentales de medidas repetidas, los DMR intrasujetos son sin duda los 
menos frecuentes. Debe tenerse en cuenta que para considerar un DMR intrasujetos como experimen- 
tal tiene que definirse al menos una variable manipulada y tiene que equilibrarse de forma aleatoria 
(aunque también son aceptables otras formas de contraequilibración efectivas) los niveles del factor (o 
factores) intrasujeto. Sin embargo, en la gran mayoría de los estudios psicológicos publicados el factor 
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intrasujetos es el tiempo, una variable que no puede considerarse como manipulada ni permite tampo- 
co aplicar secuencias de equilibración. Cuando se dan estas circunstancias el DMR deberá considerarse 
como diseño comparativo prospectivo (véase capítulo 13). 

Macizo, Bajo y Puerta (2003) aplicaron el DMR intrasujetos en una serie de experimentos para ave- 
riguar el efecto del tipo de relación entre pares de dibujos prime-target (semántica versus no relación) y 
del tiempo de presentación del prime (50, 75 y 100 ms) sobre el procesamiento semántico y léxico en la 
producción del habla. En el experimento 1 se utilizaron 30 estudiantes que pasaron por todas las combi- 
naciones de las dos variables manipuladas, controlando el orden de presentación de las combinaciones 
mediante contraequilibración aleatoria. Se aplicó un análisis univariante del DMR intrasujeto 2x 3 para 
cada una de dos modalidades, participantes o ítems, la primera utilizando como respuesta las medias 
de los tiempos de reacción para cada sujeto y la segunda las medias de los tiempos de reacción para 
cada estímulo 'target' en cada combinación de tratamiento. El análisis utilizó el enfoque univariante y 
no reveló efectos de interacción, ni tampoco efectos principales de las dos variables intrasujeto. 

Storkel (2001) investigó la influencia de la probabilidad fonotáctica (una medida de la probabilidad 
de ocurrencia de una secuencia de sonido) sobre el aprendizaje de nuevas palabras en niños pequeños. 
Participaron en el experimento 34 niños de 3 a 6 años alos que se administraron todas las combinacio- 
nes de un DMR factorial intrasujeto 2 (probabilidad fonotáctica: común versus rara) x 4 (momentos de 
prueba: 1-4-7 exposiciones acumulativas y 1 semana después). Para cada combinación y niño se regis- 
tró la proporción de respuestas correctas en tres medidas de aprendizaje: identificación de referentes, 
identificación de formas y denominación de dibujos. El análisis estadístico utilizó un enfoque multiva- 
riante con corrección de la esfericidad mediante el criterio de Huynh-Feldt y dos medidas de magnitud 
del efecto: f? y la proporción de varianza explicada. Para la primera medida de respuesta (la identi- 
ficación de referentes) no se encontró efecto de interacción, pero sí un efecto principal de probabili- 
dad fonotáctica: F(1,33) = 8.35;P < ¡DL $e = 0.25 y de la exposición: F(3,99) = 8.65;P < 001, f? = 0.26. 
En la segunda medida tampoco hubo efecto de interacción, pero sí efecto de probabilidad fonotácti- 
ca: F(1,31) = 12.64;P < .001, f? = 0.41 y de exposición: F(3,93) = 3.06; P < .05, f? = 0.10. En la tercera 
medida sólo se encontró un efecto de interacción: F(3,99) = 8.19, P<.001. 


9.7. SUGERENCIAS DE ESTUDIO 


Los enfoques univariante y multivariante para el análisis de medidas repetidas pueden consultar- 
se en referencias ya citadas sobre diseño de experimentos. A destacar Myers et al. (2010), Kirk (2013), 
Maxwell y Delaney (2004) y Winer et al. (1991). En español es también recomendable el pionero texto de 
Arnau (1986) y los más recientes de Ato y Vallejo (2007), Balluerka y Vergara (2002) y Palmer (2011). 

El enfoque mixto en el que este texto se basa es relativamente nuevo y comienza ya a perfilarse en re- 
cientes reediciones de textos clásicos de diseño, como el de Maxwell y Delaney (2004). Tratamientos más 
completos pueden consultarse en Brown y Prescott (2006) y Davis (2002). Otras referencias de interés se 
asocian con paquetes estadísticos profesionales concretos, como Littell et al. (2006), que se desarro- 
lla para el programa SAS, Pinheiro y Baltes (2000) para el programa S y su versión comercial SPLUS (y 
por extensión al programa R), Heck, Thomas y Tabata (2010) para el programa SPSS y Rabe-Hesketh y 
Skrondal (2012a,b) para el programa STATA. 

Introducciones aceptables a los modelos GEE son Ghisletta y Spini (2004) y Norton, Bieler, Ennett y 
Zarking (1996). Tratamientos más avanzados sobre este procedimiento pueden consultarse en Gibbons 
et al. (2010), Hardin y Hilbe (2013) y Lipsitz y Fitzmaurice (2009). 
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10.1. INTRODUCCIÓN 


En los ejemplos tratados en el capítulo anterior, los sujetos constituyen un grupo único de unidades 
experimentales que se observan a todos los niveles de uno (ejemplo 9.1) o dos (ejemplo 9.2) FACTORES 
INTRASUJETO, respectivamente. En el primer caso, el diseño DMR : [a] tiene una estructura de trata- 
mientos en un sentido, mientras que en el segundo el diseño DMR: [a x b] tiene una estructura de tra- 
tamientos factorial. En ambos casos, la estructura de control corresponde a una estructura de bloques 
aleatorios, donde cada bloque representa un sujeto, una estructura de control denominada CONTROL 
INTRASUJETO, y por tanto se trata de diseños no replicados. 

En ocasiones interesa al investigador analizar específicamente la variable o variables de medidas 
repetidas para los diferentes niveles de un factor de clasificación (p. ej., varones y mujeres) o bien de 
un factor de tratamiento (p. ej., diferentes formas de recompensa). En el primer caso, se introduce al- 
guna forma de bloqueo o estratificación definiendo así una nueva variable de agrupamiento, pero el 
objetivo no es usualmente el control de la heterogeneidad de las unidades experimentales, sino el in- 
terés por el cambio observado en las medidas repetidas para los niveles del factor de clasificación. Son 
comunes en Psicología factores de clasificación de tipo organísmico, tales como sexo, inteligencia, ac- 
titudes, categorías diagnósticas y un largo etcétera. En el segundo caso, se emplea asignación aleatoria 
de los tratamientos a las unidades experimentales. En cualquiera de los dos casos se utiliza un FACTOR 
INTERSUJETOS, puesto que se requieren sujetos diferentes para integrar los diferentes niveles del factor 
de clasificación o de tratamiento. 

El diseño que combina factores inter e intrasujetos se denomina por tal razón DISEÑO MIXTO, O tam- 
bién DISEÑO DE MEDIDAS PARCIALMENTE REPETIDAS!. El caso más simple de este tipo de diseño es pre- 
cisamente el que contiene un factor intersujetos y un factor intrasujetos, constituyendo una estructura 
de tratamientos factorial. Casos más complejos del mismo diseño se obtienen incrementando o bien el 
número de factores intersujetos o el de factores intrasujeto, o ambos a la vez. Todos los diseños de medi- 
das repetidas mixtos son, por su propia naturaleza, factoriales, y se distinguen entre sí especificando el 
número de factores inter e intrasujeto que emplean. La notación que utilizamos aquí, en consonancia 
con el caso general, distingue entre factores intersujetos, que se representan normalmente, y factores 


Es importante no confundir el concepto de diseño mixto, que utilizamos aquí como denominación alternativa al diseño de 
medidas parcialmente repetidas, con el de enfoque mixto, que se refiere a una opción analítica utilizada con diseños que mezclan 
factores fijos y factores aleatorios. En la literatura estadística ambos términos se usan indistintamente con referencia al análisis 
conjunto de factores fijos y aleatorios. 
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intrasujeto, que se representan dentro de corchetes, como en el diseño DMR intrasujeto. Así, un diseño 
de medidas parcialmente repetidas con un factor intersujetos A y un factor intrasujetos B se representa 
mediante DMR: ax [b]. 

Nótese que la única diferencia que existe entre los diseños de medidas total y parcialmente repe- 
tidas es la inclusión de al menos un factor intersujetos, que se supone que cumple los supuestos de 
normalidad, homogeneidad e independencia de los modelos ANOVA, como usualmente sucede. El más 
restrictivo supuesto de esfericidad/circularidad se asume solamente para los factores intrasujeto. Los 
problemas analíticos del diseño de medidas parcialmente repetidas derivan de la utilización de factores 
intrasujetos, pero no de los factores intersujetos. 

Diseños que son estructuralmente similares al diseño DMR mixto, pero que utilizan asignación alea- 
toria para distribuir los tratamientos del factor intrasujeto entre las unidades experimentales, obviando 
el uso de medidas dependientes del tiempo, son el DISEÑO DE PARCELA DIVIDIDA (split-plot design), de 
gran tradición en Ciencias Sociales y Biológicas, y el DISEÑO CONMUTATIVO (cross-over design). Ambos 
se tratan en la sección 10.5. 

Además, una condición que, como hemos tratado en capítulos anteriores, deben cumplir los DMR y 
en general los diseños que utilizan una estructura de control mediante bloqueo o emparejamiento, con o 
sin medidas repetidas, es la independencia entre la estructura de tratamientos y la estructura de control. 
Para el diseño DMR: a x [b], esta condición implica el empleo de un modelo donde las interacciones 
AxS,BxSyAxB x S se asumen igual a cero y se subsumen por tanto en el término residual. 


10.2. DMR CON UN FACTOR INTER Y UN FACTOR INTRA 


Ilustramos el más simple DMR mixto con el ejemplo 10.1. En un estudio sobre memoria a corto 
plazo se empleó una muestra aleatoria de 8 sujetos que se asignaron al azar a uno de 2 niveles de re- 
compensa, verbal 'v' versus económica 'e' (factor intersujetos recompensa), a cada uno de los cuales se 
les presentó una tarea consistente en recordar una lista de 40 códigos alfanuméricos simples. Los sujetos 
debían reportar los códigos que recordaban (variable de respuesta recuerdo) inmediatamente después 
de realizar la tarea (demora 0, d1), después de un intervalo de 5 minutos con una tarea distractora, (de- 
mora 5, d2), después de un intervalo de 15 minutos con la tarea distractora, (demora 15, d3) y después 
de media hora con la tarea distractora (demora 30, d4). Tras cada presentación se reforzó la ejecución 
correcta con la reproducción visual del código que debía ser reportado y la ejecución de la recompensa 
(verbal-económica) correspondiente. El cuadro 10.1 muestra la representación multivariante. 

Puesto que hay un factor intersujetos (recompensa, con 2 niveles) y un factor intrasujeto (demora, 
con 4 niveles), el diseño resultante es un diseño mixto o de medidas parcialmente repetidas. La notación 
que seguimos con este diseño utiliza la etiqueta general del diseño de medidas repetidas, pero distingue 
el factor o factores intersujetos del factor o factores intrasujeto que se representan entre corchetes. La 
notación para el ejemplo 10.1 sería DMR : 2 x [4], n = 8, donde n se refiere como es usual en diseños 
DMR al número de unidades experimentales. Es importante notar que hay n = 8 unidades experimen- 
tales, pero no son 8 réplicas (este concepto no suele utilizarse en diseños DMR). La unica diferencia de 
notación respecto del DMR intrasujeto es que hay factores no incluidos dentro de corchetes. 

En este diseño pueden distinguirse dos diferentes entidades de unidad experimental, una entidad 
mayor que concierne al conjunto de unidades experimentales e interesa a diferencias individuales entre 
sujetos (componente intersujetos, de nivel 2), y otro más pequeño que concierne a las diferencias dentro 
de cada sujeto en cada uno de los intervalos de demora (componente intrasujetos, de nivel 1). 
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La representación del cuadro 10.1 corresponde a una estructura de datos multivariante, que tiene 
8 filas (el número de unidades experimentales) por 6 columnas, y un total de 8 x 4 = 32 observaciones. 
La transformación a una estructura de datos univariante implica convertir a una matriz de 32 filas. Pa- 
ra ello, es preciso en primer lugar apilar la columna sujeto repitiendo cada sujeto cuatro veces (o sea, 
tantas veces como niveles tiene la variable intrasujeto); en segundo lugar, apilar también la columna 
recompensa cuatro veces por cada sujeto, en tercer lugar anexar en una misma columna d1 primero, d2 
después, d3 a continuación y finalmente d4, repitiéndolo para todos los sujetos, y llamando a la colum- 
na resultante demora. Y finalmente se precisa apilar también los valores de la variable de respuesta. El 
resultado se presenta en el cuadro 10.2. Obsérvese que las columnas de la representación univariante 
contienen todas las variables existentes: además de sujeto, el factor intersujetos recompensa, el factor 
intrasujetos demora y la variable de respuesta recuerdo. 


CUADRO 10.1 
Representación multivariante de los datos del ejemplo 10.1 


a 
ES 


recompensa 


e 


NO 006 Jo 


CUADRO 10.2 
Representación univariante de los datos del ejemplo 10.1 


sujeto | recompensa | demora | recuerdo des sujeto | recompensa | demora | recuerdo 
sl e dl 14 o) v dl 12 
sl e d2 11 S5 Y) d2 11 
sl e d3 10 2) 7) d3 10 
sl e d4 8 o) v d4 5 
s2 e dl 16 s6 7) dl 11 
s2 e d2 13 s6 v d2 8 
s2 e d3 13 s6 Y) d3 8 
s2 e d4 7 s6 v d4 7 
s3 e dl 15 s7 v dl 8 
s3 e d2 12 s7 Y) d2 9 
s3 e d3 11 s7 v d3 7 
s3 e d4 7 s7 v d4 6 
s4 e dl 13 s8 v dl 6 
s4 e d2 12 s8 Y) d2 9 
s4 e d3 12 s8 v d3 7 
sá e d4 6 s8 7) d4 5 


Sin embargo, la transformación de una representación multivariante a una representación univa- 
riante puede realizarse con la ayuda de programas específicos para esa función (p. ej., el comando VARS- 
TOCASES de SPSS). Del mismo modo se puede proceder transformando una representación univariante 
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en una representación multivariante (p. ej., el comando CASESTOVAR de SPSS). En algunos ejemplos de 
este capitulo ilustramos el uso del comando VARSTOCASES para pasar de la representación multiva- 
riante a la univariante. Para ello se necesita en primer lugar identificar las variables que constituyen 
los niveles del factor (o factores) de medidas repetidas y transformarlas con el subcomando MAKE en 
una variable de respuesta; en segundo lugar se precisa definir una variable índice cuyos valores sean 
los niveles del factor de medidas repetidas con el subcomando INDEX y finalmente hay que repetir las 
restantes variables del fichero (en el ejemplo 10.1, recompensa y sujeto) para todos los niveles del factor 
de medidas repetidas con el comando KEEP Los detalles de esta transformación pueden consultarse en 
los ficheros de sintaxis que se encuentran alojados en las páginas web citadas en la introducción. 

El análisis descriptivo de los datos del ejemplo 10.1 se presenta separadamente para la estructura 
de control (salida 10.1, que representa un bloqueo intrasujeto) y para la estructura de los tratamientos 
(salida 10.2, que muestra las medias, sumas y matrices de covarianza para cada nivel de recompensa y 
matriz de covarianza promediada para Total). 


SALIDA 10.1 
Análisis descriptivo ejemplo 10.1 (estructura del control) 


Variable dependiente: recuerdo 
sujeto | Media 


sl 10.7500 
s2 12.2500 
s3 11.2500 
sá 10.7500 


s5 9.5000 
s6 8.5000 
s7 7.5000 
s8 6.7500 
9.6563 


A e es es es e as 


wm 
N 


SALIDA 10.2 
Análisis descriptivo del ejemplo 10.1 (estructura de los tratamientos) 
Variable dependiente: recuerdo 


Matrices de covarianza 
Media dl d2 d3 da 


recompensa (A) — demora (B) 


e 


dl 
d2 
d3 
d4 


14.5000 
12.0000 
11.5000 

7.0000 


0.667 
0.667 
0.667 
0.333 


0.667 
1.000 
1.667 
0.667 


11.2500 


dl 
d2 
d3 
d4 


9.2500 
9.2500 
8.0000 
5.7500 


1.250 
1.583 
1.333 
0.917 


3.333 
1.333 
2.000 
0.333 


8.0625 


dl 
d2 
d3 
d4 


11.8750 
10.6250 
9.7500 
6.3750 


0.958 
1.125 
1.167 
0.625 


2.000 
1.167 
1.833 
0.500 


9.6563 
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Un gráfico de perfil de la interacción entre las variables recompensa y tarea se muestra en la figura 
10.1 (donde '1' corresponde a recompensa económica y '2' corresponde a recompensa verbal) y eviden- 
cia un notable paralelismo entre las líneas. Obsérvese que el recuerdo disminuye con la demora y es 
sistemáticamente mejor con recompensa económica que con verbal. 


recompensa 
:Q= 1 


10.0- 
má 2 


recuerdo 


demora 


Figura 10.1. — Gráfico de la interacción recompensax demora. 


Como tratamos en el capítulo anterior, hay tres enfoques para resolver el análisis de los datos de 
este diseño (enfoque univariante, enfoque multivariante y enfoque mixto), que abordamos en detalle a 
continuación. 


10.2.1. El enfoque univariante 


El modelo matemático más común para analizar los datos del DMR mixto mediante el procedi- 
miento univariante es el modelo básico 


Vijk=B+ Si +0j+ Pr + (06) jr + ik (10.1) 


donde a; es el efecto fijo del factor intersujetos recompensa, By es el efecto fijo del factor intrasujetos 
demora, (a f) ;z es el efecto fijo de la interacción entre recompensa y demora, que representan conjunta- 
mente el componente explicado por el modelo, y s;(;) y e;¡x son efectos aleatorios residuales. El primero 
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es un efecto de error residual para el factor intersujetos A (donde los sujetos se anidan dentro de los 
niveles del factor 4), mientras que el segundo es un efecto de error residual para el factor intrasujetos 
B (donde los sujetos se cruzan con los niveles del factor B). En consecuencia, la estructura de los trata- 
mientos es ANOVA factorial a x b, la estructura de control es bloqueo (o control) intrasujeto, donde los 
bloques son sujetos que se anidan dentro de los niveles del factor intersujetos, y la estructura de error es 
múltiple, correspondiente a dos entidades de unidad experimental. Recuérdese además que una condi- 
ción que tienen que cumplir los diseños de medidas repetidas es que no se incluyan las interacciones del 
factor de sujetos con el factor de tratamientos. El cumplimiento de esta condición debe comprobarse 
aplicando la prueba de aditividad propuesta por Tukey (1955). 

La partición de la SCT en el diseño de medidas parcialmente repetidas considera dos fuentes de 
error, porque existen dos diferentes tamaños de unidad experimental. El tamaño mayor corresponde 
a diferencias individuales intersujetos en el factor A, se representa por S(A4) y se evalúa con el efecto 
aleatorio residual s;(;), cuyo objeto es fundamentar la prueba del factor intersujetos A. El tamaño menor 
corresponde a diferencias intrasujeto en el factor B, se representa por B x S(A) y se evalúa con el efecto 
aleatorio residual e;;z, cuyo objeto es la prueba del factor intrasujetos B y de la interacción AB. La figura 
10.2 describe esta partición en comparación con el DCA factorial equivalente. 


DEA DMR 


Componente 
S(A) intersujetos 


Total BxS(A) 


Componente 
intrasujetos 


AB 


AB 


Figura 10.2. — Descomposición de la variación en el DMR con un factor inter y un factor intrasujetos. 


Las fuentes de variación con sus respectivas esperanzas para las medias cuadráticas y las razones F 
apropiadas para el diseño DMR: a x [b], suponiendo fijos ambos factores inter e intrasujeto, se presen- 
tan en el cuadro 10.3. Nótese que los dos componentes de error existentes se utilizan junto a las fuentes 
de variación que se asocian a tales componentes. Así, el factor intersujetos A se prueba exclusivamen- 
te con la fuente de error intersujetos S(A), mientras que el factor intrasujetos B y la interacción AB se 
prueban con la fuente de error intrasujetos B x S(A). 

Un resumen delos cálculos necesarios para obtener las cantidades básicas y las sumas de cuadrados 
del ANOVA se muestra en el cuadro 10.4. Adviértase la ambigiiedad que puede generar la notación em- 
pleada, en concreto la de la cantidad básica 12 S;;/b en la línea 2, donde se utilizan los subíndices i y j 
para referirse a sumas de sujetos para todos los niveles de B (a partir de la salida 10.1), y la de la cantidad 
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básica Y Y (n-— DSi = SCsían) en la línea 6, donde los subíndices ¡ y k se emplean para referirse a va- 
rianzas de las combinaciones de factor (elementos diagonales de la matrices de covarianza de la salida 
10.2). Los subíndices determinan en este caso si las cantidades se refieren a sujetos o a varianzas. 


Fuentes de variación 


CUADRO 10.3 
Grados de libertad, esperanzas y razones F del DMR: ax [b] 


Grados de liber 


tad E(MC) 


Razones F 


Intersujetos 
A 


S(A) 


Intrasujetos 
B 


AB 
BxS(A) 


(a—-1) 
aín-1) 


(b-1) 
(a—1)(b—1) 
a(b-D(n-1 


02+ bo? +nb0% 


a? + bo. 


2 2 
sap +Na0 


2 2 2 
TEFHO gn 


2 2 
) ER ap 


02+0 


CUADRO 10.4 
Resumen de cálculo de las Sumas de Cuadrados del DMR: 2 x [4] 


A/S(A) 


BIBxS(A) 
AxBIBxS(A) 


Cantidades básicas 


Procedimiento de cálculo 


No términos 


1]= 7?/abn (309)2/32 =2983.781 | 1 

S] =E ES;,/b (1433? 14+...+(27)2/4=3088.250 | 8 

A] =E A5/bn (18012/16+(129)?/16=3065.062 | 2 

Bl=Y Bi/an (952/8+...+(50)2/8=3116.875 | 4 

AB] =E E ABS, In (58)?/4+...+(23)?/4=3214.75 | 8 

R] = SCs(AB) =EX(M- DSi, (3).667+...+0.917) =50.251 | (3)(6) 
Sumas de cuadrados Procedimiento de cálculo G. libertad 

SCaA=[4)- 11) 3065.062— 2983.781 =81.281 | gl4=1 

SCg =[B]- [1] 3116.875-—2983.781= 133.094 | glg=3 

SCag =[4B]-[4]-[B]+[1] 3214.75+...+2983.781 =16.594 | gl1g=3 

SCs(a) = 15114) 3088.25 — 3065.062 =23.188 | gls(a) =6 

SCr =[R]-[S]+[4] 50.251 23.188 =27.063 | glg=18 

SCm = SCA +SCs(a) + SCg + SCag 81.281+...+16.594=254.157 | gly=13 

SCr =SCm+SCr 254.157+27.063=281.220 | gly =31 


Una simplificación del modelo básico (no aditivo) que hemos considerado hasta aquí es posible si el 
componente de interacción entre tratamientos A(recompensa) x B(demora) no resultara estadísticamen- 
te significativo. Estudios anteriores sobre la temática objeto de investigación han recomendado analizar 
la interacción a un nivel de significación riguroso. Adoptamos con esta finalidad el nivel de significación 
del 1% para interpretar las razones F del ejemplo 10.1. El modelo (aditivo) resultante se formula como 


Yijk= M4 Si 


q) +0aj+ Br ijr 


(10.2) 
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donde los componentes de interacción Ax S y B x S se asumen incluidos en el componente residual, el 
término e;¿x, absorbiendo asimismo sus grados de libertad. 

La aplicación de la prueba de aditividad de Tukey desgaja del denominador del componente residual 
un grado de libertad para probar el efecto de las interacciones A x S y B x S. Obviamente, la interacción 
Ax S es un componente del modelo, que se etiqueta con S(A) porque los sujetos se anidan dentro de 
los niveles del factor A (de hecho no tendría ningún sentido el componente A x S(4)), pero la interac- 
ción B x S(A) sí es objeto de evaluación y es precisamente el objeto esencial de la aplicación. La prueba 
de aditividad obtiene un componente de no aditividad igual a SCya = 6.772, con glya = 1 grado de 
libertad, y deja una SC residual de 27.063 — 6.772 = 20.291 con 18-—1 = 17 grados de libertad. La ra- 
zón F resultante es FyA(6.772/1) / (20.291/17) = 5.674 y el resultado de la prueba de aditividad sería: 
Fa, 17) = 5.674; P = .029. En consecuencia, se acepta la hipótesis (nula) de que el modelo es aditivo, 
porque la prueba no es estadísticamente significativa al nivel del 1%. 

El correspondiente ANOVA para el modelo no aditivo de la Ecuación 10.1, que incluye la interacción 
entre los factores inter e intrasujeto, se presenta en la salida 10.3 y muestra que, adoptando el nivel de 
significación del 1% recomendado para esta temática, el ajuste global relativo no es aceptable, ya que 
aunque Fy (13,18) = 10.210; P < .001, y son significativos los efectos de recompensa: F(1, 6) = 21.032; P = 
.004, y demora: F(3,18) = 29.508; P = .000, no lo es el efecto de la interacción recompensa x demora; 
F(3,18) = 3.679; P = .032. El modelo aditivo se muestra en la salida 10.4 y ajusta óptimamente. 


SALIDA 10.3 
ANOVA para el modelo interactivo del DMR:2 x [4], n=8 


Fuente SC tipo IM F 
Modelo 254.157 10.210? 


Intersujetos 
A 81.281 21.0324 


S(A) 23.188 


Intrasujetos 

B 133.094 29.508? 

AxB 16.594 3.679? 
Residual 27.063 
Total 281.220 
4 MCsa)»> b MCr 


SALIDA 10.4 
ANOVA para el modelo aditivo del DMR :2 x [4], n=8 


Fuente SC tipo IM 
Modelo 237.563 
Intersujetos 
A 81.281 
S(A) 23.188 
Intrasujetos 
B 133.094 
Residual 43.657 
Total 281.220 
e MCs(a)»> b MCr 
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El enfoque univariante concluye que, al nivel de significación del 1%, los efectos principales de re- 
compensa y demora deben ser el objeto central de interpretación. La conclusión principal es que el re- 
cuerdo es mejor con recompensa económica que con recompensa verbal y se reduce drásticamente a 
medida que aumenta la demora de la tarea distractora. Pero la cuestión esencial es que esta conclusión 
solo es válida cuando se verifica que los datos cumplen con el supuesto de simetría compuesta (o el algo 
menos restrictivo supuesto de esfericidad). Si no fuera así, esta conclusión no sería válida. Pero desde el 
enfoque univariante no es posible probar si se cumple o no el supuesto de simetría compuesta. Por esta 
razón, los investigadores recurren al enfoque multivariante. 


10.2.2. El enfoque multivariante 


Como se trató en el capítulo anterior, el enfoque multivariante se centra únicamente en la estima- 
ción del componente intrasujetos (demora) y su interacción con el componente intersujetos (demora x 
recompensa), puesto que la estimación del componente intersujetos no presenta ningún problema (ya 
que no son medidas repetidas). El resultado se muestra en la salida 10.5. 


SALIDA 10.5 
Enfoque multivariante para un DMR con un factor inter y un factor intra 


Criterios multivariantes 


Efecto Criterio Valor F gl glo P>F 
demora Traza de Pillai 0.957 | 29.635 3 4 .003 
Lambda de Wilks 0.043 | 29.635 3 4 .003 
Traza de Hotelling 22.226 | 29.635 3 4 .003 
Raíz mayor de Roy 22.226 | 29.635 3 4 .003 
demorax recompensa Traza de Pillai 0.556 1.672 3 4 -309 
Lambda de Wilks 0.444 1.672 3 4 .309 
Traza de Hotelling 1.254 1.672 3 4 -309 
Raíz mayor de Roy 1.254 1.672 3 4 -309 
Prueba de Mauchly e índices de ajuste epsilon 
Efecto W de Mauchly e gl P>x GG HF 
demora 0.258 6.401 5 .278 0.721 1.000 
ANOVA efectos intrasujeto DMR 
Fuente Índice SC tipo HI gl MC F P>F 
demora Asumiendo esfericidad 133.094 3 | 44.365 | 29.508 .000 
Greenhouse-Geisser 133.094 2.163 | 61.538 — 29.508 .000 
Huynh-Feldt 133.094 3.000 | 44.365 | 29.508 .000 
demora x recompensa | Asumiendo esfericidad 16.594 3 5.531 3.679 .032 
Greenhouse-Geisser 16.594 2.163 7.672 3.679 .052 
Huynh-Feldt 16.594 3.000 5.531 3.679 .032 
Error residual Asumiendo esfericidad 27.063 18 1.503 
Greenhouse-Geisser 27.063 | 12.977 2.085 
Huynh-Feldt 27.063 | 18.000 1.503 
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La razón F obtenida con cualquiera de los criterios estadísticos multivariantes es Fg (3,4) = 29.635; P = 
.003 para el factor intrasujetos y F4g(3,4) = 1.672; P = .309 para la interacción. Nótese que en el DMR 
mixto los grados de libertad del numerador son g1?,,,,, = b—1=3 para el factor intrasujetos y glfB, (a— 
D(b- 1) = (1)(3) = 3 para la interacción, pero para el denominador es en ambos casos gl¿en = N— gló - 
al = 8- 1-3 =4, del tal modo que la suma es ahora n-— 1 (en lugar de n, como sucedía en el DMR 
intrasujeto), y es la consecuencia de incorporar un factor intersujetos y su interacción con el factor in- 
trasujetos. 

Para reproducir los resultados del ANOVA mediante el enfoque multivariante se prueba primero el 
supuesto de esfericidad mediante la prueba de Mauchly. La salida 10.5 muestra que la prueba aproxi- 
mada con [(b)(b— 1)/2]—1 = 5 grados de libertad y distribuida según e es 165) = 6.401; P = .278, lo que 
nos lleva a concluir que en este ejemplo se cumple el supuesto de esfericidad. Por otra parte, si se desea 
utilizar el factor de corrección de los grados de libertad para numerador y denominador (e), nótese que 
el criterio de Greenhouse y Geisser produce un valor diferente de 1, y por tanto supondrá cambios en 
los grados de libertad de numerador y denominador de los efectos, pero no supondrá cambios en los 
grados de libertad con el criterio de Huynh-Feldt. 

En cualquier caso, puesto que con los datos del ejemplo 10.1 la prueba de Mauchly no es significa- 
tiva, la única información que interesa de la salida 10.5 es la que corresponde a la primera línea ('esferi- 
cidad asumida!) para cada uno de sus componentes. Así, F(3,18) = 29.508; P < .001 muestra diferencias 
significativas para el factor demora y F(3,18) = 3.679; P = .032 muestra que, al nivel del 1%, no hay di- 
ferencias significativas para la interacción, un resultado que coincide con el de la prueba multivariante, 
ya que F(3, 4) = 1.672; P = .309. Si el supuesto de esfericidad no se hubiera cumplido, o si el investigador 
deseara utilizar alguno de los criterios alternativos por considerar que se ha producido una cierta viola- 
ción del supuesto, la interpretación descansaría sobre otras líneas de la salida 10.5, ajustando los grados 
de libertad de numerador y denominador con el factor de corrección e. Nótese que el valor de la prueba 
F es el mismo, pero los valores de probabilidad pueden diferir. Así, al nivel de significación establecido 
del 1%, en ningún caso es significativo el efecto de la interacción demora x recompensa. Con el criterio 
GG no sería significativo al 5%, Fg(2.163, 12,977) = 3.679; P = .052, mientras que con el criterio HF el 
resultado es el mismo que para la esfericidad asumida, ya que el factor de corrección es €yf = 1. 

Una ventaja importante del enfoque multivariante es que las pruebas multivariantes (MANOVA) son 
válidas se cumpla o no el supuesto de esfericidad. Aunque se requiere que cumplan los supuestos de 
normalidad y homogeneidad multivariantes (con independencia de la forma que adopten las matrices 
de covarianza, éstas deberán ser iguales bajo los diferentes niveles del factor entre sujetos). Desde el 
enfoque multivariante también se reproduce el análisis de varianza univariante (ANOVA) y sus razones 
F se construyen bajo la condición de que se cumpla el supuesto de esfericidad o bien ajustando los 
grados de libertad de numerador y denominador en el caso de que el supuesto no se cumpla. Pero el 
enfoque multivariante asume una estructura de covarianza diferente a la del enfoque univariante. 


10.2.3. El enfoque mixto y el modelado de estructuras de covarianza 


Nótese que los resultados del enfoque univariante (salida 10.4) y multivariante (salida 10.5) para 
probar el factor intrasujetos demora resultarían muy diferentes si se hubiera adoptado el nivel de sig- 
nificación del 5%, puesto que el investigador llegaría con el primer enfoque a la conclusión de que hay 
un efecto de interacción entre recompensa y demora, FA (3,18) = 3.679; P = .032, mientras que con el 
segundo enfoque las pruebas multivariantes le llevarían a la conclusión de que no hay efecto de in- 
teracción, F1p(3,4) = 1.672; P = .309. Ambos enfoques presentan diferencias importantes tanto en la 
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magnitud de la razón F para el factor intrasujeto como en los respectivos grados de libertad del nu- 
merador y denominador de la razón F. Para el factor intrasujeto, con el enfoque univariante la razón 
obtenida es F5 (3,18) = 29.508; P = .000, mientras que en el enfoque multivariante la razón equivalente 
es Fg(3,5) = 29.635; P = .003. Recuerde que lo mismo sucedía con los diseños de medidas totalmente 
repetidas. Aunque en este ejemplo las dos pruebas F son significativas, en algunos casos pueden pro- 
ducirse conclusiones diferentes, planteando un dilema al investigador. 

La discrepancia entre el enfoque univariante y multivariante se debe esencialmente a que ambos 
enfoques se basan en la utilización de diferentes supuestos acerca de la estructura de covarianza de las 
medidas repetidas: 


— En el enfoque univariante se asume homogeneidad de las varianzas y de las covarianzas entre los 
niveles del factor intrasujeto (B), un supuesto que se sustancia en la estructura de covarianza de 
SIMETRÍA COMPUESTA (SC), de dimensión 4x4 en el ejemplo 10.1 (ya que b = 4 es el número de 
niveles del factor intrasujeto demora). En esta estructura de covarianza hay una varianza única en 
las casillas de la diagonal principal (homogeneidad de las varianzas) y una covarianza única en las 
casillas no diagonales (homogeneidad de las covarianzas), lo que supone un total de 2 parámetros 
a estimar. 


— En el enfoque multivariante por el contrario se asume heterogeneidad de las varianzas y heteroge- 
neidad de las covarianzas. En esta estructura de covarianza, que llamamos matriz de covarianza 
NO ESTRUCTURADA (NE), hay una varianza diferente para cada una de las 4 casillas diagonales 
y un valor de covarianza también diferente para cada una de las 6 casillas no diagonales, lo que 
requiere la estimación de un total de [a(a+ 1)]/2 = (4)(5)/2=4+6= 10 parámetros. 


Para representar la dependencia de las medidas repetidas, es obvio que la estructura de covarianza 
NE es la más realista, porque el modelado se basa exactamente en las varianzas y covarianzas estimadas 
a partir de los datos empíricos. De hecho, la matriz de covarianza SC es una restricción de la matriz 
NE que asume homogeneidad de los valores diagonales y homogeneidad de los valores no diagonales. 
Esta es precisamente una de las razones por la que el enfoque multivariante se popularizó durante las 
décadas de los 80-90, porque, en el caso de discrepancia, probablemente será más apropiada la decisión 
basada en los resultados del enfoque multivariante que la del enfoque univariante. Pero precisamente 
por ser empíricamente la más realista, la matriz de covarianza NE presenta el inconveniente de ser poco 
parsimoniosa, ya que requiere estimar más parámetros que la matriz de simetría compuesta. 

Sin embargo, el que sea empíricamente más realista no quiere decir que sea la más apropiada. Am- 
bas son sólo dos de las estructuras de covarianza posibles para explicar los datos empíricos. Hay otras 
muchas estructuras que pueden ser apropiadas en ciertos casos. Lo que hoy por hoy se considera más 
conveniente es MODELAR LA ESTRUCTURA DE COVARIANZA de las medidas repetidas buscando la estruc- 
tura más apropiada para interpretar los datos empíricos. Una estrategia recomendable consiste en co- 
menzar con la estructura más flexible (la matriz de covarianzas NE), aunque menos parsimoniosa, y 
simplificarla después probando otras estructuras de covarianza más parsimoniosas hasta encontrar la 
estructura más simple que represente mejor los datos empíricos. 

Puesto que se trata de un procedimiento de modelado estadístico, el enfoque mixto permite decidir 
cuál de dos o más estructuras de covarianza es más apropiada mediante ajuste condicional de mode- 
los, lo que supone también una ventaja crucial sobre los procedimientos univariante y multivariante. 
Su principal inconveniente (y probablemente la razón que ha justificado que no se haya popularizado 
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hasta ahora), es su complejidad computacional (estimación por máxima verosimilitud y utilización de 
complejos algoritmos iterativos) y la más complicada interpretación de los resultados. 

El ajuste condicional de modelos considera las diferencias absolutas en desvianza entre dos modelos 
y las diferencias en el número de parámetros requerido para estimar la matriz de covarianza y aplica 
la PRUEBA DE LA RAZÓN DE VEROSIMILITUD para decidir qué modelo es el que mejor ajusta. Además, 
pueden emplearse también los criterios de bondad de ajuste AIC y BIC. Los valores más bajos de los 
criterios se asocian por lo general con los modelos más apropiados. 

En cualquiera de los casos, un DMR mixto con un factor inter y un factor intra, tiene tantas matrices 
de covarianza como niveles tiene el factor intersujetos. Puesto que concierne a grupos (submuestras) de 
sujetos diferentes, el supuesto de esfericidad se denomina en este caso ESFERICIDAD MULTIMUESTRA. En 
el caso del ejemplo 10.1, hay dos matrices de covarianza, una para la submuestra de recompensa eco- 
nómica y otra para la de recompensa verbal, ambas de dimensión 4 x 4. Las dos matrices de covarianza 
se articulan en una matriz más general compuesta de 8 bloques diagonales (un bloque por cada sujeto), 
cada uno de los cuales incluye la matriz de covarianza para el sujeto del grupo que proceda (la primera 
si es recompensa económica o la segunda si es recompensa verbal). Pero los elementos de los bloques 
que no se encuentran en la diagonal son todos igual a cero. Así, asumiendo una matriz NE, la matriz 
de covarianza expandida para los datos del ejemplo 10.1 sería de dimensión 32 x 32, formada por 8 blo- 
ques de matrices 4 x 4 con la forma siguiente para el primero y el octavo bloque, en una configuración 
matricial denominada MATRIZ DIAGONAL DE BLOQUES: 


2 
O. 012 03 O14 


2 
021 07, 023 02 
031 032 03, 034 
C41 U4 Usa Uh 


Vi2x32=| : : : : : : : (10.3) 
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oooo 
oooo 
oooo 


2 
C41 Us Usa Oj, 


oooo 
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hn 
< 
Q 
hb 
[90] 
Q 
159) 
nd 


oooo: 
oooo:-: 


La estimación de la matriz diagonal de bloques (véase salida 10.2) de la Ecuación 10.3 sería, para el 
primero (motivación económica) y el último bloque (motivación verbal): 


1.667 0.667 0.667 0.333 
0.667 0.667 1.000. —0.333 
0.667 0.667 1.667  —0.677 
0.333 —0.333 -—0.667 0.667 


oooo 
oooo 
oooo 
oooo 


Une == . . . . 

7.583 1.250 3.333 0.750 
1.250 1.583 1.333 0.917 
3.333 1.333 2.000 —0.333 
0.750 —0.917  —0.333 0.917 


oooo 
oooo 
oooo 
oooo 


Para el DMR con un factor inter y un factor intra, la matriz de covarianzas sin estructura tiene que 
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cumplir en realidad dos supuestos (Winer ef al., 1991, p. 514). El primer supuesto implica que las dos es- 
tructuras de covarianza que ocupan los cuadrantes diagonales se asumen homogéneas, o sea, la matriz 
de los cuatro primeros bloques diagonales es igual (o muy similar) a la de los cuatro últimos bloques. El 
segundo supuesto es consecuencia del primero e implica que el promedio de las dos estructuras de co- 
varianza para cada nivel del factor intersujetos produce como resultado una matriz de covarianza NE, 
para la que es preciso estimar un total de [(b)(b+- 1)]/2 = (4)(5)/2 = 10 parámetros. El promedio de las dos 
matrices de covarianza sin estructura de la Ecuación 10.3, utilizando la media elemento a elemento de 
las dos matrices de covarianza para los dos niveles de recompensa (económica y verbal) es la siguiente: 


4.625 0.958 2.000 0.542 
1.583 1.125 1.167  —0.625 
2.000 1.167 1.833  —0.500 
0.542 —0.625 —0.500 0.792 


Esta es la matriz de covarianza NE que se estima en el enfoque mixto cuando se asume que las subma- 
trices de covarianza de que se compone son homogenéneas. Representa por tanto el promedio de las 
dos matrices de covarianza, cada una correspondiente a un nivel del factor intersujetos (recompensa 
económica-verbal). Compruébese este resultado en la salida 10.2, que presenta las matrices de cova- 
rianza para cada nivel del factor intersujetos y la matriz de covarianza promediada para Total. 


Vsg = 


A. Enfoque mixto con matriz de covarianzas no estructurada 


En la salida 10.6 se presentan los resultados del enfoque mixto aplicado a los datos del ejemplo 10.1, 
utilizando una matriz de covarianza no estructurada. 


SALIDA 10.6 
Análisis del DMR:2 x [4], n= 8 con matriz NE mediante enfoque mixto 

Estructura de covarianza Loglik Desvianza (q) AIC BIC 

No estructurada (NE) 33.661 67.321 (18) 87.321 99.102 

Efectos aleatorios 

Parámetros Estimador E. típico Z de Wald | P>|zl 
Varianza NE(1, 1) 4.625 2.670 1.732 .083 
Varianza NE(2,2) 1.125 0.650 1.732 .083 
Varianza NE(3, 3) 1.833 1.058 1.732 .083 
Varianza NE(4,4) 0.792 0.457 1.732 .083 
Covarianza NE(1,2) 0.958 1.010 0.949 .343 
Covarianza NE(1,3) 2.000 1.442 1.387 .166 
Covarianza NE(1,4) 0.542 0.812 0.667 .505 
Covarianza NE(2,3) 1.117 0.755 1.544 122 
Covarianza NE(2,4) 0.625 0.462 1.353 .176 
Covarianza NE(3,4) 0.500 0.533 0.939 .348 

Efectos fijos 

Fuentes de variación £8lnum 8lden F P>F 
recompensa 1 6 21.032 .004 
demora 3 6 44.452 .000 
recompensax demora 3 6 2.507 .156 
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Como tratamos en el capítulo anterior, la primera parte de la salida 10.6 es un resumen general 
del modelo, con la estructura de covarianza, la función de verosimilitud maximizada (LL), la desvianza 
(-2LL), el número de parámetros (q) utilizado y los criterios AIC y BIC para la comparación de mode- 
los alternativos. Con esta información se puede valorar el ajuste global absoluto del modelo. Siendo la 
desvianza D = 67.321 y los grados de libertad residuales N — q = 32-18 = 14, el ajuste global absoluto 
no es aceptable, con 14) = 67.321;P = .000 (o sea, el modelo difiere significativamente del modelo 
saturado). La segunda parte de la salida exhibe los estimadores de los efectos aleatorios del modelo, o 
sea, los parámetros de la matriz de covarianza promediada que se derivó anteriormente. Cuando un 
modelo emplea factores intrasujeto, es posible modelar sus varianzas y covarianzas. El modelo no adi- 
tivo con matriz de covarianza NE es el modelo más complejo que se puede proponer para explicar los 
datos empíricos, porque requiere la estimación de todos los parámetros de la matriz de covarianzas, O 
sea, un total de [(b)(b+ D)1/2 = [(4)(5)]/2 = 10 parámetros, donde b = 4 son los niveles del factor intra- 
sujetos. Observe que son exactamente los que hemos calculado anteriormente de forma directa y los 
que se presentaron en la salida 10.2. La tercera parte de la salida presenta el análisis de varianza de las 
fuentes de variación correspondientes a los efectos fijos del modelo. 

Es importante advertir que la valoración del ajuste global del modelo no debe efectuarse nunca con 
un modelo de transición. Es esencial buscar primero el mejor modelo con la matriz de covarianza más 
parsimoniosa posible y una vez seleccionado aplicar finalmente la prueba de la razón de verosimilitud 
para evaluar el ajuste global relativo del modelo. No obstante, para este modelo el ajuste global relativo 
no sería aceptable, ya que la interacción no es significativa. 

Nótese además que, aunque el enfoque mixto con matriz de covarianza no estructurada es equiva- 
lente al enfoque multivariante, ni la prueba F ni los grados de libertad para el efecto del factor intrasujeto 
demora son iguales a los que se obtuvieron con el enfoque multivariante de la salida 10.5. 

El modelo resultante no es un modelo parsimonioso puesto que se estiman todos los parámetros de 
covarianza, o sea, se estima un valor diferente para cada una las varianzas de la diagonal de la matriz y un 
valor diferente para cada una de las covarianzas. Sin embargo, es sin lugar a dudas la mejor estimación 
de las varianzas y covarianzas empíricas y por ello muchas veces se toma como punto de partida para 
considerar otras matrices de covarianza alternativas. 


B. Enfoque mixto con matriz de covarianza de simetría compuesta 


En la salida 10.7 se resumen los resultados del enfoque mixto asumiendo que se cumple el modelo no 
aditivo pero con matriz de covarianza de simetría compuesta. Esta matriz de covarianza debe cumplir 
dos requisitos. En primer lugar, se asume homogeneidad de varianzas en las dos matrices diagonales 
de bloques, requisito básico para poder promediar ambas matrices, y en segundo lugar, el promedio 
de ambas matrices diagonales de bloques debe satisfacer el supuesto de esfericidad o circularidad. La 
matriz de covarianzas promediada que se asume presenta entonces la forma siguiente: 


+0 6 6? 6? 2.094 0.590 0.590 0.590 
00 0 6+6s5  6s 6? | [0.590 2.094 0.590 0.590 
a IS 6  6%+6, 6% | |0.590 0.59 2.094 0.590 

ú% 6? o?  62%+6?) 0.590 0.59 0.590 2.094 


donde se observa que se cumple homogeneidad de las varianzas y homogeneidad de las covarianzas 
en la matriz promediada. La matriz de covarianza que se asume para simetría compuesta de hecho 
puede obtenerse también promediando las varianzas y covarianzas de la matriz no estructurada que 
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utilizamos anteriormente. El promedio de sus varianzas y covarianzas es, respectivamente, 


4.625+1.125+ 1.8335+ 0.792 

4 = 2.094 
.9583 + 2+.5417+ 1.1667 — 0.625 — 0.500 
ANT EN = 0.590 


var = 
coUu = 
donde var ocupa los elementos diagonales de la matriz de simetría compuesta y cov ocupa los elemen- 


tos no diagonales. Los promedios var y cov son también útiles para estimar los componentes residuales 
del modelo, ya que, como puede comprobar en la salida 10.3, 


MCpxsta) = var—cou=2.094— 0.590 = 1.504 
MCs) = var+(b-1)cov= 2.094 + (3)(0.590) = 3.865 
SALIDA 10.7 
Análisis del DMR:2 x [4], n=8 con matriz SC mediante enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Simetría compuesta 47.325 94.651 (10) 98.651 101.007 
Efectos aleatorios 
Parámetros Estimador E. típico Z de Wald | P>|zl 
Varianza SC 1.504 0.501 3.000 .000 
Covarianza SC 0.590 0.572 1.032 .302 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 
recompensa 1 6 21.032 .004 
demora 3 18 29.508 .000 
recompensax demora 3 18 3.679 .032 


Es obvio que la matriz de covarianza SC es muy diferente a la de la matriz de covarianza NE. Los 
estadísticos de ajuste revelan que se usan sólo 2 parámetros aleatorios (a? y 0?) y 8 parámetros fijos 
(1 para la constante más 7 para los efectos fijos del modelo), y por tanto se trata de un modelo más 
parsimonioso, pero los índices AIC = 98.651 y BIC = 101.007 son considerablemente mayores que los 
obtenidos con la matriz de covarianzas NE. 

El procedimiento de comparación de modelos es de importancia crucial en este contexto, puesto 
que nos permite decidir cuál de las dos estructuras de covarianza es la más apropiada desde el punto 
de vista estadístico calculando la diferencia absoluta entre las desvianzas y la diferencia entre el núme- 
ro de parámetros del modelo más complejo y del modelo más simple. La diferencia en desvianza AD 
se distribuye según y? con grados de libertad igual a la diferencia entre el número de parámetros de 
ambos modelos. Si la probabilidad es significativa (p. ej., P < 0.05), ambos modelos no se consideran 
equivalentes, las diferencias entre ambos son relevantes y por tanto puede afirmarse que el modelo más 
complejo es el modelo óptimo; en cambio, si la probabilidad no es estadísticamente significativa, ambos 
modelos se considerarán equivalentes y por tanto se puede aceptar el modelo más simple como mejor 
descripción de los datos observados. 

Comparando el modelo con matriz NE y el modelo con matriz SC obtenemos una diferencia abso- 
luta en desvianza de AD = |94.651 —67.321| = 27.330 y una diferencia absoluta en el número de paráme- 
tros de Aq=|10-18|=8 parámetros. La prueba de la razón de verosimilitud es: x?(8) = 28.330; P = .001 
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(véase salida 10.8). La diferencia entre los dos modelos es estadísticamente significativa, y por tanto 
se prefiere el modelo más complejo (modelo 1, con matriz NE) al modelo más simple (modelo 2, con 
matriz SC), que no representa adecuadamente los datos empíricos. 


SALIDA 10.8 
Ajuste condicional de los modelos con matriz NE y SC del DMR :2 x [4],n= 8 
Modelo 1: DMR mixto con matriz SC 
Modelo 2: DMR mixto con matriz NE 


Modelo | Desvianza 
1 94.651 


2 67.321 


La salida 10.8 apunta que, si no hubiera otra matriz de covarianza más apropiada, la interpretación final 
debería descansar en la salida 10.6. Sin embargo, no es recomendable interpretar un modelo con la 
matriz de covarianzas no estructurada. 


C. Enfoque mixto con matriz de covarianza HF de Huynh-Feldt 


En general, un modelo estimado con matriz de covarianza NE no es un modelo de interés porque 
es poco parsimonioso y requiere estimar demasiados parámetros. El investigador debe entonces con- 
siderar estructuras de covarianza más parsimoniosas que se ajusten también a los datos. Hay muchas 
posibles estructuras que podrían probarse (véase Vallejo y Livacic-Rojas, 2005). Todos los paquetes es- 
tadísticos profesionales proponen varios tipos de estructuras para modelar las varianzas y covarianzas 
en los diseños con medidas repetidas. Una de las estructuras más frecuentemente elegida es la ESTRUC- 
TURA DE COVARIANZA DE HUYNH Y FELDT, que en muchas ocasiones obtiene ajustes muy precisos con 
diseños de medidas repetidas en investigaciones psicológicas, puesto que se basa en el criterio ey. pro- 
puesto por tales autores. Esta estructura asume varianzas diferentes para la diagonal principal (o sea, 
asume heterogeneidad de varianzas) y un parámetro de correlación común A (lambda”), que se aplica 
a los elementos no diagonales. Promediando para todos los niveles del factor intersujetos la estructura 
de covarianza de Huynh-Feldt presenta la forma siguiente: 


2 2: 2 2 2 2 
2 01 +0) A 07 +03 2 0¡+0y A 
1 2 2 2 
2 2 2. 2 2 2 
09+0] a az a ES POA 
Var=| ,%, , , S a (10.4) 
AO O 2 03404 _) 
2 2 3 2 
2 2 2 2 2 2 
O¿+01 a 04+0) A d¿+03 A a 
2 2 2 4 


Utilizando esta estructura de covarianza se obtienen los resultados de la salida 10.9 en el forma- 
to ya conocido de salidas anteriores. A destacar de la salida los grados de libertad del denominador 
para el efecto fijo intersujetos de recompensa, que se obtiene aplicando procedimientos complejos de 
computación. Sin embargo, los efectos intrasujeto de demora y recompensa x demora son similares a los 
obtenidos con la matriz de simetría compuesta. 
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SALIDA 10.9 
Análisis del DMR :2 x [4] con matriz HF mediante enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Simetría compuesta 37.727 75.455 (13) 85.455 91.345 
Efectos aleatorios 
Parámetros Estimador E. típico Z de Wald | P>|zl 
Varianza [demora=d1] 3.278 1.117 2.935 .003 
Varianza [demora=d2] 1.469 0.631 2.328 .020 
Varianza [demora=d3] 1.828 0.717 2.551 .011 
Varianza [demora=d4] 0.591 0.213 2.773 .006 
Lambda de Huynh-Feldt 1.503 0.501 3.000 .003 
Efectos fijos 
Fuentes de variación £8lnum 8lden F P>F 
recompensa 1 15.662 30.598 .000 
demora 3 18 29.508 .000 
recompensa x demora 3 18 3.679 .032 


La matriz estimada de covarianza HF, promediada para los dos niveles de recompensa puede obte- 
nerse tomando los estimadores de la salida 10.9 y presenta la forma siguiente: 


3.2783  .8701 1.0499  .4312 
SF _|-.8702 1.4690  .1452  -.4735 


HF (1.0499 .1452 1.8285 -—.2937 
4312 -.4735 -—.2937 .5911 


Conviene notar que, en lo que concierne a las varianzas de las diferencias entre niveles, esta matriz de 
covarianza cumple con el supuesto de esfericidad, ya que las varianzas de las diferencias entre pares 
de niveles es constante. Es obvio que las varianzas y covarianzas de la matriz de covarianza anterior no 
parecen homogéneas; sin embargo, aplicando la Ecuación 9.14 obtenemos: 


6%, = 3.2783+1.4690- (2)(.8701) = 3.0071 
6%, = 3.2783+1.8285- (2)(1.0499) = 3.0071 
6%, = 3.2783+.5911- (2)(4312) = 3.0071 
6%, =  1.4690+1.8285- (2)(.1452) = 3.0071 
0%, = 1.4690+.5911- (2)(—.4735) = 3.0071 
62, = 1.8285+.5911- (2).2937) = 3.0071 


Nótese además que los estadísticos de ajuste son menores que los obtenidos con las matrices de 
covarianza NE y SC. En el cuadro 10.5 se han resumido los criterios estadísticos AIC y BIC de los tres 
modelos que comparamos, los modelos con matrices de covarianza NE, SC y HF. Todos ellos tienen 
en común el que reproducen aproximadamente la misma estructura de los efectos fijos. Sin embargo, 
la medida de desvianza es un criterio que mide la desviación respecto del modelo saturado. Por esta 


OEdiciones Pirámide 


378 Diseños de investigación en Psicología 


razón, la desvianza será tanto más pequeña cuanto mayor sea el número de parámetros utilizado. Por 
esta razón, la comparación requiere también incorporar el número de parámetros que se emplea en 
cada modelo. Los criterios AIC y BIC ponderan el valor de desvianza con el número de parámetros. 


CUADRO 10.5 
Resumen de los criterios estadísticos de ajuste 


Criterios estadísticos | Matriz NE  MatrizSC | Matriz HF 
AIC 98.651 
BIC 101.007 


Desvianza (D) 94.651 
No parámetros (q) 10 


A la vista del cuadro 10.5, el modelo con matriz de covarianza de Huynh-Feldt requiere sólo 5 pará- 
metros para los efectos aleatorios (13 parámetros en total incluyendo los 8 parámetros para los efectos 
fijos) y es por tanto un modelo más parsimonioso que el modelo con matriz NE, que requiere 10 pará- 
metros de efectos aleatorios (18 parámetros en total), aunque no tanto como el modelo con matriz SC, 
que requiere 2 parámetros de efectos aleatorios (10 parámetros en total). Por esta razón, la desvianza se 
espera que sea mayor en el modelo con matriz SC, seguida por el modelo con matriz AF y finalmen- 
te por el modelo con matriz SE. Sin embargo, los más bajos valores en los dos criterios estadísticos de 
ajuste (A/C y BIC) aparecen sistemáticamente con el modelo con matriz HF. 

La prueba formal de comparación del modelo con matriz de covarianza HF con respecto del modelo 
resultante del ajuste condicional anterior (modelo con matriz de covarianza NE) obtiene una diferen- 
cia absoluta en desvianza de AD = 8.134 con Aq =18-—13=5. La prueba de la razón de verosimilitud es 
15) = 8.134; P =.149, y se ha resumido en la salida 10.10. La diferencia no es estadísticamente signifi- 
cativa y por tanto podemos considerar como mejor modelo el modelo con matriz HF. 


SALIDA 10.10 
Ajuste condicional de los modelos con matriz NE y HF del DMR:2 x [4],n=8 
Modelo 1: DMR con matriz SC 
Modelo 2: DMR con matriz NE 
Desvianza 
75.455 


67.321 


Una vez encontrada la matriz de covarianza óptima, pueden interpretarse los resultados de los efec- 
tos fijos del modelo con matriz HF. Pero puesto que se ha decidido operar con el nivel de signifi- 
cación del 1%, se requiere primero simplificar el modelo eliminando el componente de interacción 
no significativo. El modelo aditivo con matriz HF (que no se muestra aquí) aporta una desvianza de 
D(10) = 91.304 (una vez eliminados los grados de libertad de la interacción), y efectos significativos de 
recompensa, F4(1,6) = 91.596; P < .001 y demora, Fg(3,21) = 21.341; P < .001. Para evaluar el ajuste glo- 
bal relativo de este modelo se estima también el modelo nulo con matriz HF (que tampoco se muestra 
aquí), aportando una desvianza de D(6) = 139.705 (los grados de libertad son la suma de los paráme- 
tros aleatorios más la intersección). La diferencia absoluta entre el modelo HF aditivo y el modelo HF 
nulo es: AD = |139.705 — 91.304] = 48.401, con una diferencia absoluta en número de parámetros de 
Aq = |6- 10] = 4. Esta diferencia es estadísticamente significativa: x?(4) = 48.401; P < .001, y por tanto 
puede afirmarse que el ajuste global relativo del modelo HF aditivo es satisfactorio. 
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10.3. Generalización del DMR mixto 


Hay dos formas básicas de generalizar el DMR mixto básico con un factor intersujetos (4) y un 
factor intrasujetos (B): ampliar el número de factores intersujetos y/o el número de factores intrasujeto. 
En ambos casos se establece una partición de la Suma de Cuadrados Total (SC7) en dos porciones, 
inter e intrasujetos, en cada una de las cuales se repercute la ampliación a más de dos factores con la 
incorporación de los componentes de interacción. Se asumen dos entidades de unidad experimental, de 
naturaleza intersujetos para el tamaño mayor y de naturaleza intrasujeto para el tamaño menor. Y como 
en todos los DMR se asume también que no existe interacción entre la variable de sujeto (estructura de 
control) y las variables de tratamiento (estructura de tratamiento). 

Por ejemplo, el DMR con dos factores intersujetos (A y B) y un factor intrasujetos (C) supone una 
tabla ANOVA como la que se reproduce en el cuadro 10.6. En comparación con la tabla ANOVA del 
DMR: ax![b], en el diseño DMR: ax bx [c] la porción intersujetos contiene dos factores (A y B) y su 
interacción (AB), mientras que en la porción intrasujetos se incluyen todas las interacciones entre el 
factor intrasujeto y los factores intersujetos (o sea, las interacciones AC, BC y ABC). Los dos compo- 
nentes de error, inter e intrasujetos, se definen sin embargo del mismo modo que con el caso general 
de un factor inter y un factor intra. Una ventaja de la partición en dos componentes de error es que las 
razones F para las fuentes de variación se aplican de forma independiente dentro de cada componente. 


CUADRO 10.6 
DMR con 2 factores intersujetos (A y B) y un factor intrasujetos (C) 


Fuentes Grados de libertad | E(MC) con A,B y C fijos | Razón F 


Intersujetos 


+nbco? A/S(AB) 
B/S(AB) 


AB/S(AB) 


Z 2 
a-1 ¿+0 (q p) 


2 
s(af) 
2 
s(af) 
s(a 6) 


b-1 02+c0 
(a- 1D) (b-1) 
ab(n-1) 


+ naco; 


02+c0 +nc0? 
a 


B 
S(AB) 


Intrasujetos 


O +CO 


C 
AC 
BC 


CxS(AB) 


c-1 
(a- 1D)(c-1) 
(b-D(c-1) 
(a- 1D) (b-1)(c-1) 
ab(c-1D)(n-1) 


0l.+0 + nabos 


2 
sy(af) 
2 
sy(af) 
2 

sy(ap) Br 


0l+0 + NDA 


0l+0 +nab? 
al+0? 


2 
sy(aB) + nos 


Br 


Og+0 


C/CxS(AB) 
AC/CxS(AB) 
BC/CxS(AB) 
ABC/CxS(AB) 


sy(af) 


Del mismo modo, el DMR con un factor intersujetos (4) y dos factores intrasujeto (B y C) utiliza una 
tabla ANOVA como la que se muestra en el cuadro 10.7. Observe la partición en varias fuentes residua- 
les de la variación total de la porción intrasujetos. Así, los componentes B y AB utilizan como fuente 
residual B x S(A4), los componentes C y AC emplean como fuente residual C x S(4) y los componen- 
tes BC y ABC tienen como fuente residual BC x S(A). Y como puede comprobarse en el desarrollo de 
las E(MO), se facilita la interpretación al asignar a cada fuente de variación componentes específicos 
de error. Asumimos en todos los casos que los factores inter e intrasujetos siguen un modelo de efec- 
tos fijos. Si alguno de los factores se definiera mediante efectos aleatorios las esperanzas de las medias 
cuadráticas podrían sufrir variaciones (p. ej, utilizar como denominador una interacción en lugar de un 
componente residual). 
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Fuentes 


CUADRO 10.7 
DMR con un factor intersujetos (A) y dos factores intrasujeto (B y C) 


Grados de libertad 


E(MO) con A,B y C fijos 


Razón F 


Intersujetos 
A 


S(A) 


a—-1 
aín—1) 


+nbco? 


2 
a 


A/S(A) 


Intrasujetos 
B 


AB 
BxS(A) 
C 

AC 
CxS(A) 
BC 

ABC 
BCxS(A) 


b-1 
(a—- 1D)(b-1) 
a(b-1D)(n-1) 
c-1 
(a- D(c-1) 
aíc-1D)(n-1) 
(b- D(c—-1) 
(a- D(b- 1D)(c-1) 
a(b-D(c-D(n-1) 


2 
+ nabo; 


Brsta) + 00 ey 


Bysa) 


B/BxS(A) 
AB/BxS(A) 


C/CxS(A) 
AC/CxS(A) 


BC/BCxS(A) 
ABC/BCxS(A) 


10.4. DMR con dos factores inter y un factor intra 


Un investigador se interesó por evaluar el efecto de la ansiedad (factor A, con niveles al: alta y a2: 
baja), medida mediante un cuestionario de ansiedad, y la tensión muscular (factor B, con niveles bl: 
alta y b2: baja), que dependía de la presión ejercida sobre un dinamómetro, sobre el rendimiento en una 
tarea de aprendizaje. La mitad de los sujetos que puntuaron alto en ansiedad fueron asignados al azar a 
la condición de alta tensión muscular y la otra mitad a la condición de baja tensión muscular. Lo mismo 
ocurrió con los sujetos que puntuaron bajo en ansiedad. Todos los sujetos recibieron cuatro bloques 
consecutivos de ensayos (factor C, con niveles cl a c4), en cada uno de los cuales se midió el número 
de errores cometido en la tarea de aprendizaje. Los datos empíricos del ejemplo 10.2 se presentan en el 
cuadro 10.8 (representación multivariante) y en el cuadro 10.9 (representación univariante). 


CUADRO 10.8 

Ejemplo 10.2: representación multivariante 

ansiedad | tensión | sujetos ensayo (C) 
(4) (B) (S) dl 2 3 a 
al bl sl 18 14 12 6 
s2 19 12 8 4 
s3 14 10 6 2 
b2 s4 16 12 10 4 
Ss5 12 8 6 2 
s6 18 10 5 1 
al bl s7 16 10 8 4 
s8 18 8 4 1 
s9 16 12 6 2 
b2 s10 19 16 10 8 
s11 16 14 10 9 
s12 16 12 8 8 
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CUADRO 10.9 
Datos del Ejemplo 10.2: representación univariante 


sujeto | A B C | rendim 


Recuérdese que si los datos se introducen en un paquete estadístico con la representación multiva- 
riante puede ejecutarse el enfoque multivariante, pero no sirve para el resto de los enfoques, univariante 
y mixto. En cambio, si los datos se introducen con la representación univariante se pueden ejecutar los 
enfoques univariante y/o mixto, pero no sirve para el enfoque multivariante. 

El análisis descriptivo abreviado de los datos del ejemplo 10.2 se aborda en las salidas 10.11 y 10.12. 
Nótese que, para la computación estadística, se han separado la estructura de los tratamientos (Ax Bx C 
en la salida 10.11, donde se ha prescindido de las sumas totales para ahorrar espacio) de la estructura 
de control (bloqueo intrasujeto: un bloque es igual a un sujeto, en la salida 10.12, que presenta sumas, 
medias y varianzas para cada sujeto). 

Un gráfico de perfiles de la interacción entre ansiedad y tensión, para cada nivel de ensayo, se pre- 
senta en la figura 10.3. Observe que la interacción muestra una tendencia descendente a lo largo de los 
ensayos, lo que indica que el número de errores disminuye con la ejecución de los ensayos. Además, 
esta representación permite también detectar la naturaleza no ordinal de la interacción A x B, como se 
manifiesta en todos los casos. Esta figura es un ejemplo ilustrativo de la necesidad de explorar en detalle 
los gráficos de perfiles para detectar efectos de interés para el investigador. 
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Análisis descriptivo ejemplo 10.2 (estructura de los tratamientos) 


SALIDA 10.11 


Variable dependiente: recuerdo 


ansiedad 


tensión 


ensayo 


Media 


Varianza 


al 


b1 


1.00 
2.00 
3.00 
4.00 


17.0000 
12.0000 
8.6667 
4.0000 


7.000 
4.000 
9.333 
4.000 


1.00 
2.00 
3.00 
4.00 


15.3333 
10.0000 
7.0000 
2.3333 


9.333 
4.000 
7.000 
2.333 


1.00 
2.00 
3.00 
4.00 


16.6667 
10.0000 
6.0000 
2.3333 


1.333 
4.000 
4.000 
2.333 


1.00 
2.00 
3.00 
4.00 


17.0000 
14.0000 
9.3333 
8.3333 


SALIDA 10.12 
Análisis descriptivo ejemplo 10.2 (estructura de control) 


Variable dependiente: recuerdo 


sujeto 


Media 


3.000 
4.000 
1.333 
0.333 


sl 
s2 
s3 
sá 
s5 
s6 


s7 
s8 
s9 


12.5000 
10.7500 
8.0000 
10.5000 
7.0000 
8.5000 
9.5000 
7.7500 
9.0000 
13.2500 
12.2500 
11.0000 
10.0000 


SS 


ds 
do 


DVD 0 wo ujo waa ufo ww jo y e wa 
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ensayo=1 


recuerdo.mean 


ansiedad 


ensayo=3 


recuerdo.mean 


ansiedad 


tension 


tension 
o 1 
sh 2 


recuerdo.mean 


recuerdo.mean 


ensayo=2 
tension 
1 
sde 2 
A 
a a ñ 
E a É 
ansiedad 
ensayo=4 
tension 
1 
sh 2 
A 


ansiedad 


Figura 10.3. — Gráficos de interacción ansiedadx tensión para cada nivel de ensayo. 


10.4.1. El enfoque univariante 


Comenzando con el enfoque univariante clásico, la ecuación para el modelo de efectos, asumiendo 
independencia entre el factor de sujetos y los factores de tratamiento, es la siguiente: 


Yi ji = MH Sip FA + Br lab) + y + lan ¡+ (BN xi + (a By) ¡xi + ei 5x1 (10.5) 


donde s;( ¡k) es un efecto residual (aleatorio) de los factores intersujetos (los sujetos se anidan dentro de 
las combinaciones AB), a ;, Px y y: son efectos fijos de los factores intersujetos ansiedad y tensión y del 
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factor intrasujetos ensayo, (a P) jo [AN ¡1 (BN 1 y la By) ¡ki son efectos de interacción y e; AS el error 
residual. Este modelo es un modelo interactivo de segundo orden porque incluye interacciones entre 
tres factores. El diseño que se asume es un DMR:axbx [c]. 

Respecto al DCA factorial típico, la partición de la SC7 en el DMR del ejemplo 10.2 se resume en 
la figura 10.4 y considera dos fuentes de error porque hay dos diferentes entidades de unidad experi- 
mental: una fuente de error intersujetos (componente S(AB)), que corresponde al tamaño mayor de la 
unidad experimental (diferencias individuales intersujetos), cuyo objeto es fundamentar la prueba de 
los factores intersujetos A y B y de su interacción AB, y una fuente de error intrasujeto (componente 
C x S(AB)), que corresponde al tamaño menor de unidad experimental (diferencias intrasujeto entre 
bloques de ensayos), cuyo objeto es la prueba del factor intrasujeto C y de sus interacciones con los 
factores intersujetos (interacciones AC, BC y ABC). 


DCA / [a n DMR 
B >] B Componente 
intersujetos 
AB||—————————>AB 
S(AB) 
Sao 
Total CS(AB) 
Cc Cc 
Componente 


AC — AC intrasujetos 


Figura 10.4. — Descomposición de la SC Total en el DMR: ax bx [cl]. 


Submodelos más simples que el modelo de la Ecuación 10.5 son posibles eliminando algún o algu- 
nos de los componentes de interacción entre factores de tratamiento implicados en el mismo nivel de la 
jerarquía, preferentemente mediante ajuste condicional de modelos. Los submodelos posibles son los 
siguientes: 


— el submodelo de primer orden intrasujeto, que contiene todas las interacciones de primer orden 
entre factores de tratamiento, las del componente inter y las del intrasujeto (AB, AC y BC): 


Yijki = BH Sii FO Bra) je + yt lan ¡+ (BN xi + € 511 (10.6) 


— el submodelo de primer orden intersujetos, que prescinde de las interacciones de primer orden 
intrasujetos (AC y BC): 


Yijki= MH Sip FO Pr l(aB) jet Y IF ijrl (10.7) 
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— y finalmente el submodelo de efectos principales, que prescinde de todas las interacciones inter e 
intrasujeto y considera sólo los efectos principales: 


Yi ¡ni = MH Si¡x) +05 + Br+Y1+ ij (10.8) 


Las fuentes de variación, los grados de libertad, las medias cuadráticas y sus esperanzas matemáticas 
y las razones F apropiadas para el diseño DMR:2x2 x [4], n = 12, suponiendo fijos ambos factores inter 
e intrasujetos, se presentaron en el cuadro 10.6. Las respectivas sumas de cuadrados para cada una de 
las fuentes de variación del modelo interactivo de segundo orden del cuadro 10.6 pueden obtenerse, 
previa consulta de los estadísticos descriptivos de la salidas 10.11 y 10.12 (aunque algunas de las sumas 
tendrán que obtenerse de forma manual), calculando primero las cantidades básicas y el número de 
términos y construyendo después las sumas de cuadrados y sus correspondientes grados de libertad, a 
partir de las fórmulas de cálculo simplificadas que se desarrollan en el cuadro 10.10. 


CUADRO 10.10 
Resumen de cálculo del modelo interactivo de 22 orden para el DMR:2x2 x [4], n=12 


Cantidades básicas Procedimiento de cálculo No términos 
1) = 7? /abcn (480)?/48=4800 | 1 
A] =E Aj/ben (229)2/24 + (251)2/24 =4810.083 | 2 
Bl=Y Bi/acn (230)? /24 + (250)2/24 =4808.333 | 2 
C]=Y C?/abn (198)?/12+...+(50)?/12=5791.5 | 4 
AB] =E E ABS, len (125)?/12+...+ (146)?/12=4898.5 | (2)(2)=4 
AC] =YE E ACi,/bn (972/6+...+(32)2/6=5810 | (2)(4)=8 
BC]=YE E BCi,/an (100?/6+...+(3212/6=5812 | (2)(4)=8 
SABI=E LES; ¡yy /0 (50?/4+...+(44)?/4=4981 | (31(21(2)=12 
ABC] = EXE ABCi,,/m (51)?/3+...+(25)?/3=5923.333 | (2)(2)(4)=16 
R]=1 (n= DSi (207 +...+0.333) = 134.667 | (2)(12)=24 
Sumas de cuadrados Procedimiento de cálculo Grados de libertad 
SCa=[4]- [1] 4810.083 — 4800= 10.083 | 1 
SCg =[B]- [1] 4808.333 — 4800=8.333 | 1 
SCc =1C]-[1) 5791.5-4800=991.5 | 3 
SCas = [AB]- [4] -[B]+ [1] 4898.5—...+4800= 80.084 | 1 
SCac = [AC]— [4] - [€] + [1] 5810—...+4800=8.417 | 3 
SCpc =[BC] -[B]-[C] + [1] 5812—...+4800=12.167 | 3 
SCagc = [ABC] - [BC] - [4C] — [AB]+ 5923.333 —...—4898.5+ 
+[C]+[B]+[4] — [1] +4898.5+...—4800= 12.750 | 3 
SCs(ag) = [SAB] — [AB] 4981-4898.5=82.5 | 8 
SCexsiaB) = [RI] — [5] + [AB] 134.667 —82.5= 52.167 | 24 
SCu = SC4+SCp+SCag+SCs(aB)+ 10.083 + 8.333 + 991.5 + 80.084+ 
+SCc + SCac +SCpc+SCaBc +8.417+12.167+12.75=1205.834 | 23 
SCR = SCBxS(AB) 52.167 | 24 
SCr =SCy+SCr 1205.834+52.166 = 1258.000 | 47 
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La salida 10.13 presenta el ANOVA correspondiente al modelo de segundo orden para los datos del 
DMR:2x2x [4], n= 12. Nótese que en la porción intersujetos del modelo la interacción es estadística- 
mente significativa con P < .05, y por tanto se aplica el principio de marginalidad para interpretar las 
fuentes de variación que afectan a la porción intersujetos. En la porción intrasujetos, en cambio, hay 
interacciones que no son significativas, por lo que hay que proceder a su eliminación con el objeto de 
conseguir un modelo parsimonioso. En primer lugar, se comienza eliminando la interacción de segundo 
orden ABC. El resultado se muestra en la salida 10.14, que representa un modelo interactivo de primer 
orden. En este modelo se observa también que las interacciones de primer orden AC y BC no son sig- 
nificativas, por lo que es necesario proceder a su eliminación. El resultado final se muestra en la salida 
10.15, que representa un modelo interactivo de primer orden simplificado. 


SALIDA 10.13 
ANOVA del modelo interactivo de segundo orden 


Variable dependiente: rendim 


SC tipo III 


Fuente 


MC 


Modelo 
Intersujetos 
A 
B 
AxB 
S(Ax B) 
Intrasujetos 
C 
AxC 
BxC 
AxBxC 


1205.834 


10.083 

8.333 
80.084 
82.500 


991.500 
8.417 
12.167 
12.750 


Residual [Cx S(Ax B)] 52.167 


52.427 


10.083 

8.333 
80.084 
10.313 


330.500 — 152.051 
2.806 1.291 
4.056 1.866 
4.250 1.955 
2.174 


Total 


1258.000 


SALIDA 10.14 
ANOVA del modelo interactivo de primer orden 


Variable dependiente: rendim 


Fuente 


SC tipo IM 


MC 


Modelo 
Intersujetos 
A 
B 
AxB 
S(Ax B) 
Intrasujetos 
C 
AxC 
BxC 

Residual 


1193.083 


10.083 

8.333 
80.084 
82.500 


991.500 
8.417 
12.167 
64.917 


59.654 


10.083 

8.333 
80.084 
10.313 


330.500 
2.806 
4.056 
2.404 


137.461 
1.167 
1.687 


Total 


1258.000 
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SALIDA 10.15 
ANOVA del modelo interactivo de primer orden simplificado 
Variable dependiente: rendim 
Fuente SC tipo III MC 
Modelo 1172.5 83.75 
Intersujetos 
A 10.083 10.083 
B 8.333 8.333 
AxB 80.084 80.084 
S(Ax B) 82.500 10.313 
Intrasujetos 
C 991.500 330.500 | 127.561 
Residual 85.500 2.591 
Total 1258.000 


Nótese que el modelo de la salida 10.14 no puede simplificarse en mayor medida, puesto que para el 
componente intrasujetos es significativo el factor ensayos: Fc (3,33) = 127.561; P = .000 y para el compo- 
nente intersujetos es significativa la interacción ansiedad x tensión: Fag (1,8) = 7.766; P = .024. El ajuste 
global relativo del modelo es por tanto aceptable: Fy/(14,33) = 32.323; P = .000. La magnitud del efecto 
para C representa casi el 64% de la varianza total (07 = 0.635) , mientras que el efecto de la interacción 
Ax B es mucho más modesto (4 4 = 0.045). 


10.4.2. El enfoque multivariante 


Es importante recalcar que el enfoque multivariante solamente opera con el factor intrasujeto C 
(ensayos), y las interacciones del factor intrasujeto con los factores intersujetos. Todos los efectos inter- 
sujetos que se obtienen con el enfoque multivariante son los mismos que se obtienen con el enfoque 
univariante, y por ello no serán reproducidos aquí (véase salida 10.16). 


SALIDA 10.16 
Enfoque multivariante con el modelo interactivo simplificado del DMR:2x2 x [4] 


Criterios multivariantes 


Efecto Criterio Valor F gl glo P>F 
ensayo Traza de Pillai 0.958 | 68.051 3 9 .000 
Lambda de Wilks 0.042 | 68.051 3 9 .000 
Traza de Hotelling 22.684 | 68.051 3 9 .000 
Raíz mayor de Roy 22.684 | 68.051 3 9 .000 
Prueba de Mauchly e índices de ajuste epsilon 
Efecto W de Mauchly Y gl P>yx GG HF 
ensayo 0.398 8.957 5 .112 0.622 0.744 
ANOVA efectos intrasujeto DMR 

Fuente Índice SC tipo HI gl MC F P>F 
ensayo Asumiendo esfericidad 991.500 3 | 330.500 | 127.561 .000 
Greenhouse-Geisser 991.500 1.865 | 531.709 | 127.561 .000 
Huynh-Feldt 991.500 2.231 | 444.504 | 127.561 .000 

Error(ensayo) | Asumiendo esfericidad 85.500 33 2.591 

Greenhouse-Geisser 85.500 | 20.512 4.168 

Huynh-Feldt 85.500 | 24.536 3.485 
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La primera parte de la salida 10.16 obtiene los estimadores de los criterios estadísticos multiva- 
riantes y los convierte a una razón F, de más fácil interpretación. Para este ejemplo todos los criterios 
apuntan la existencia de diferencias estadísticamente significativas para el factor intrasujetos: Fc (3,9) = 
68.051; P < .001. La segunda parte de la salida exhibe la prueba de Mauchly, que no es significativa: 
Ci 6) = 8.957;P = .112 (puede asumirse por tanto que se cumple el supuesto de esfericidad), y se 
calculan los criterios ¿66 = 0.622 y £yr = 0.744. El investigador se encuentra entonces en disposi- 
ción de asumir esfericidad o utilizar cualquiera de los dos criterios para interpretar la tercera parte de 
la salida. Si asume esfericidad, concluirá que hay diferencias significativas entre ensayos: Fc(3,33) = 
127.561; P < .001. Si decide utilizar el criterio £GG, llegará también a la misma conclusión pero con 
Fc(1.865, 20.512) = 127.561; P < .001. 


10.4.3. El enfoque mixto 


Como tratamos anteriormente, el enfoque mixto tiene la ventaja potencial de que permite modelar 
de forma independiente medias y covarianzas. El modelado de las medias se realiza de la forma conven- 
cional con un ANOVA para los efectos fijos del modelo, mediante un proceso por el que se eliminan del 
modelo aquellos componentes no significativos bajo la aplicación estricta del principio de marginalidad 
de Nelder. El modelado de las covarianzas consiste en probar de forma sucesiva diferentes estructuras 
de covarianza para determinar cuál de ellas es la más conveniente. 

Como sabemos, usualmente se comienza con la matriz de covarianza más compleja, la matriz de 
covarianza no estructurada. La salida 10.17 resume los resultados del enfoque mixto para el modelo de 
primer orden simplificado asumiendo una matriz NE. 


SALIDA 10.17 

Análisis del DMR:2 x 2 x [4], n=12 con matriz NE mediante enfoque mixto 

Estructura de covarianza Loglik Desvianza (q) AIC BIC 
No estructurada (NE) 78.972 157.943 (17) 177.943 195.079 
Efectos aleatorios 
Parámetros Estimador E. típico Z deWald  P>|z| 
Varianza NE(1,1) 18.761 9.036 2.076 .038 
Varianza NE(2,2) 10.476 5.363 1.953 .051 
Varianza NE(3, 3) 15.329 7.473 2.051 .040 
Varianza NE(4,4) 4.966 2.864 1.734 .083 
Covarianza NE(1,2) 11.982 6.614 1.812 070 
Covarianza NE(1,3) 13.215 7.568 1.746 .081 
Covarianza NE(1, 4) 6.943 4.713 1.473 .141 
Covarianza NE(2,3) 11.800 6.173 1.911 .056 
Covarianza NE(2,4) 6.255 3.779 1.655 .098 
Covarianza NE(3, 4) 8.556 4.613 1.855 .064 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 

ansiedad 1 8 171.022 .000 
tensión 1 8 86.058 .000 
ansiedadx tensión 1 8 200.806 .000 
ensayo 3 11 83.174 .000 
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Téngase en cuenta que el programa trabaja con una matriz diagonal de bloques de dimensión 16 x 
16, ya que la estructura de los tratamientos intersujetos es 2 x 2 y la estructura de los tratamientos in- 
trasujetos es 4, lo que implica una matriz de covarianza 4 x 4 para cada una de las 2 x 2 posiciones 
diagonales. Utilizando los estimadores de la salida 10.17, la matriz de covarianza NE promediada tiene 
la forma siguiente: 
18.7608 11.9818 13.2151 6.9428 
FS  _|11.9818 10.4756 11.7998 6.2548 
VNE=[13.2151 117998 15.3286 8.5563 
6.9428 6.2548 8.5563 4.9657 


que muestra moderadas desviaciones de la homogeneidad de las varianzas y probablemente también 
de las covarianzas. Por ejemplo, o es Casi 4 veces mayor que ó% y 614 es la mitad de 63. 

La matriz de covarianza NE es una matriz poco parsimoniosa, y en general, no suele ser objeto de 
interpretación. Para seleccionar una matriz de covarianza más parsimoniosa, se suele comenzar con 
una matriz con estructura muy simple, por ejemplo, la matriz de covarianza de simetría compuesta. 
Los resultados del modelo interactivo de primer orden simplificado para el DMR:2x2x [4], n= 12 con 
matriz SC se presenta en la salida 10.18. 


SALIDA 10.18 
Análisis del DMR:2 x 2 x [4], n= 12 con matriz SC mediante enfoque mixto 


Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Simetría compuesta -91.222 182.444 (9) 186.444 189.871 
Efectos aleatorios 

Parámetros Estimador E. típico Z de Wald | P>|lzl 
Varianza SC 2.591 0.638 4.062 .000 
Covarianza SC 1.930 1.299 1.486 .137 

Efectos fijos 
Fuentes de variación £lnum 8lden F P>F 
ansiedad 1 8 0.978 .352 
tensión 1 8 0.808 .395 
ansiedadx tensión 1 8 7.766 .024 
ensayo 3 33 127.561 .000 


A partir de los resultados de la salida 10.18, la estimación de la matriz de covarianza SC promediada 
es la siguiente: 
4.501 1.930 1.930 1.930 
1.930 4.501 1.930 1.930 
1.930 1.930 4.501 1.930 
1.930 1.930 1.930 4.501 


Vsc = 


que como se observa presenta notables divergencias respecto de la matriz de covarianza NE, pero en 
concreto son sensiblemente diferentes las razones F y la significación de los efectos fijos del modelo. Por 
lo demás, para esta matriz de covarianza los resultados son iguales que los de la salida 10.15, ya que el 
enfoque univariante asume una matriz de covarianza SC. Este modelo estima un total de 9 parámetros, 
de los cuales 7 son parámetros de efectos fijos: 1 para constante o intersección (que no se muestra en la 
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salida), 1 para A, 1 para B, 1 para AB y 3 para C, y 2 son los parámetros de efectos aleatorios correspon- 
dientes a las estimaciones de las varianzas y covarianzas homogéneas o iguales. 

Aunque los criterios A/C y BIC son más pequeños en el modelo con matriz NE que en el modelo 
con matriz SC, el ajuste condicional del modelo interactivo de primer orden simplificado para el diseño 
mixto con matrices SC y NE se resume en la salida 10.19. La prueba permite concluir que hay diferencias 
significativas entre los dos, por lo que el modelo con matriz NE es mejor que el modelo con matriz SC. 


SALIDA 10.19 
Ajuste condicional de los modelos con matriz SC y NE del DMR:2x2x [4], n= 12 
Modelo 1: DMR mixto con matriz SC 
Modelo 2: DMR mixto con matriz NE 
Modelo | Desvianza 
1 182.444 


2 157.978 


El modelo con matriz de covarianza NE es, como se sabe, un modelo poco parsimonioso, pero es 
mejor que el modelo con matriz SC. Es preciso buscar un modelo con matriz más parsimoniosa para 
interpretar los resultados del ajuste. Entre los modelos más parsimoniosos que podrían ser candidatos 
más aceptables se seleccionó para este ejemplo el modelo con MATRIZ DE COVARIANZAS AUTOREGRESIVA 
DE PRIMER ORDEN HETEROGÉNEA (AR Hl), que presenta la forma siguiente: 


2 2 3 
dí 0102P 0103pP 0104P 
2 2 
y _| 0201P 0) 0203P 0204P 10.9 
ARH1= 2 2 (10.9) 
0301P 0302P 03 0304P 
3 2 2 
0401P 0402P 0403P 4 


donde 0?,...,a? son varianzas (que se asumen heterogéneas), 91,..., 94 son sus correspondientes des- 
1 4 


viaciones típicas y p es la correlación existente entre las medidas repetidas. Esta matriz se construye 
bajo el supuesto de que la correlación será menor cuanto más se demore en el tiempo la medida (en 
este ejemplo, los bloques de ensayos). Los resultados del ajuste del modelo interactivo de primer orden 
simplificado con matriz ARH1 se resumen en la salida 10.20. 

Utilizando la salida 10.20, la estimación de la matriz de covarianza ARH1 promediada es: 


15.220 8.791 8.708 3.821 
y _| 8.791 6.847 6.783 2.976 
ARHLU | 8,708 6.783 9.059 3.975 

3.821 2.976 3.975 2.352 


Por ejemplo, los valores de la primera fila/columna se obtienen, salvando errores de redondeo, utilizan- 
do la ecuación 10.9, 


8.791 = (.861) y (15.220) (6.847) 
8.708 = (861)? y/(15.220)(9.059) 
3.821 = (861)? y (15.220) (2.352) 
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SALIDA 10.20 
Análisis del DMR:2 x 2 x [4] con matriz ARH1 mediante enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Autoregresiva heterogénea 1 —83.583 167.166 (12) 177.166 185.734 
| Efectos aleatorios | 
Parámetros Estimador E. típico Z de Wald | P>|z| 
Varianza [bloque = 1] 15.220 7.645 1.991 .046 
Varianza [bloque = 2] 6.847 3.655 1.873 .061 
Varianza [bloque = 3] 9.059 4.396 2.061 .039 
Varianza [bloque = 4] 2.352 1.224 1.921 .055 
Correlación ARH1 0.861 0.080 10.803 .000 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 
ansiedad 1 8 22.263 .002 
tensión 1 8 16.647 .004 
ansiedadx tensión 1 8 43.933 .000 
ensayo 3 33 76.184 .000 


Obsérvese en la salida 10.20 que el modelo con matriz ARH1 requiere la estimación de 12 paráme- 
tros, a saber, 1 para la intercepción, 6 para los efectos fijos y 5 para la matriz de covarianza. Comparando 
con anteriores salidas, los criterios A/C y BIC son en este caso ambiguos, puesto que el primero es me- 
nor con la matriz ARH1 y el segundo es menor con la matriz NE. Conviene recordar a este respecto 
que los criterios AC y BIC son sólo aproximaciones. En caso de duda, el ajuste condicional nos per- 
mite acceder a la decisión correcta. La salida 10.21 compara los dos modelos, donde la diferencia (en 
valores absolutos) entre los dos no es estadísticamente significativa y por tanto se recomienda aceptar 
el modelo más simple como modelo óptimo, o sea, el modelo con matriz ARHI. 


SALIDA 10.21 
Ajuste condicional de los modelos con matrices ARH1 y NE del DMR:2x2x [4], n= 12 
Modelo 1: DMR mixto con matriz ARH1 
Modelo 2: DMR mixto con matriz NE 


Modelo | Desvianza 


167.166 
157.978 


Una vez encontrado el modelo óptimo, la interpretación de los resultados (salida 10.20) apunta que 
es significativo el efecto de la interacción: F1g(1,8) = 43.993; P = .002. Este ejemplo confirma que el 
enfoque univariante puede producir resultados inapropiados si la matriz de covarianza en que se basa 
no aproxima la estructura de covarianza que se asume en la población. El cambio que se produce en 
las razones F con el enfoque mixto puede ser considerable y afectar dramáticamente la interpretación 
de los resultados que se haría desde del enfoque univariante. De ahí que el análisis de los DMR con el 
enfoque mixto, en menoscabo de los enfoques univariante y multivariante, se haya convertido hoy por 
hoy en una obligada necesidad si se desean interpretar adecuadamente las investigaciones que emplean 
medidas repetidas. 
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10.5. Diseños con estructura similar al DMR mixto 


10.5.1. El diseño de parcela dividida (DP D) 


Un caso muy común de diseño en la investigación agrícola, y también de la investigación en Psico- 
logía y Ciencias de la Salud, es el DISEÑO DE PARCELA DIVIDIDA, DPD (split-plot), cuya denominación 
hace referencia a la subdivisión de una extensión de tierra en parcelas homogéneas (plots), y éstas a su 
vez en subparcelas (subplots). Es muy similar a un DMR mixto, con los sujetos anidados dentro de los 
niveles de un factor de tratamiento o clasificación A que se cruza con los niveles de otro factor de tra- 
tamiento B, en una estructura denominada parcialmente anidada (Quinn y Keough, 2002). Ilustramos 
esta forma de diseño con el ejemplo 10.3 (adaptado de Maxwell y Delaney, 2004), en el que a dos grupos 
de individuos de diferente edad (20 años de media el primer grupo y 60 años el segundo) se les presenta 
aleatoriamente una serie de estímulos mediante taquistoscopio con diferentes grados de alejamiento 
del centro (ángulos de 0%, 42 y 89) y se les registra el tiempo de reacción en segundos requerido para 
emitir una respuesta de localización. La representación multivariante se muestra en el cuadro 10.11. 


CUADRO 10.11 
Representación multivariante de los datos del ejemplo 10.3 


ángulo (B) 
edad (A) | sujeto (S) Qo 4o go 
20 sl 0.510 
20 s2 0.480 
20 s3 0.630 
20 s4 0.660 
20 Ss5 0.660 
20 s6 0.450 
20 s7 0.600 
20 s8 0.660 
20 s9 0.660 
20 0.540 
60 0.570 
60 0.720 
60 0.540 
60 0.660 
60 0.570 
60 0.780 
60 0.690 
60 0.570 
60 0.750 
60 0.690 


La estructura del DPD es muy similar a la del DMR mixto, aunque los supuestos del análisis es- 
tadístico son algo diferentes (Federer y King, 2007). La estructura de los tratamientos del ejemplo 10.3 
implica un factorial 2 x [3] con medidas repetidas en el factor B, y su estructura de control está repre- 
sentada por 20 sujetos, anidados en el factor A, cada uno de los cuales recibe todos los tratamientos del 
factor B (bloqueo mediante control intrasujeto). La diferencia fundamental con el DMR mixto es que 
los tratamientos del factor B no se administran a las unidades experimentales siguiendo una secuencia 
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controlada mediante contraequilibración aleatoria, sino en un orden estrictamente determinado por 
azar. Así, a la unidad experimental sl se le podría asignar por azar primero el estímulo con 8%, des- 
pués el tratamiento con 0* y finalmente el tratamiento con 4* de inclinación, a la unidad s2 primero 
40, después 8% y finalmente 0%, etc. La figura 10.4 ilustra gráficamente la naturaleza del diseño DPD, 
asumiendo aleatorización restringida para el factor A, que es el caso más común en Psicología y el que 
ilustra el ejemplo 10.3, aunque en algunas aplicaciones se utiliza también aleatorización completa. 


UNIDADES EXPERIMENTALES 


DO39 8090 
HO33 2098 


ESTRUCTURA DE 
LOS TRATAMIENTOS 


(Factorial 2 x 4) 


b1 b2 b3 b4 


Figura 10.4. — Representación del Diseño de Parcela Dividida (DPD). 


Como el diseño DMR mixto, el diseño DPD distingue también dos entidades de unidad experi- 
mental: una entidad mayor, que corresponde a los sujetos y persigue la evaluación de las diferencias 
intersujetos, y otra entidad menor, que corresponde a la ejecución de cada sujeto con diferentes grados 
de inclinación respecto del centro y persigue la evaluación de las diferencias intrasujetos. En conse- 
cuencia, como en el DMR intrasujeto hay dos términos de error en el DP D mixto: un error intersujetos, 
S(4) y un error intrasujetos que representa el término residual del modelo, B x S(4). Se asume también 
independencia entre la estructura de tratamientos y la estructura de control. El modelo matemático que 
sustenta el análisis es similar al del DMR mixto, 


Yijk = HjkESijHijk 
Yijk = HRS) +0j+Br+(0B) jr + Cijk (10.10) 


pero el supuesto de independencia de las observaciones, que por lo general se incumple y representa un 
grave problema en el DMR, no representa un problema tan grave en el DPD al permitir la asignación 


OEdiciones Pirámide 


394 Diseños de investigación en Psicología 


aleatoria de los tratamientos del factor B. La notación del diseño es también similar. Asumiendo efectos 
fijos para ambos factores, el diseño del ejemplo 10.3 se representaría como DPD:2 x [3],n=20. 

Analizamos los datos del ejemplo 10.3 mediante el enfoque mixto, obviando los enfoques univarian- 
te y multivariante. La estructura de covarianza más común del DPD es la estructura SC, pero como 
sucede con todos los modelos evaluados desde el enfoque mixto, es necesario aplicar la estrategia de 
análisis que recomendamos en este texto buscando la estructura de covarianza que mejor representa 
los datos empíricos. La salida 10.22 es un resumen del enfoque mixto asumiendo una estructura de co- 
varianza de simetría compuesta. Nótese en particular que la desvianza es negativa debido a la escala de 
medida de la variable de respuesta. 


SALIDA 10.22 
Análisis del DBD:2 x [4], n =20 con matriz SC mediante enfoque mixto 


Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Simetría compuesta 69.420 -138.840 (8) —134.840 —130.862 
Efectos aleatorios 

Parámetros Estimador E. típico Zde Wald | P>|zl 
Varianza SC 0.0015 0.0004 4.243 .000 
Covarianza SC 0.0056 0.0020 2.746 .006 

Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 

edad 1 18 7.276 .015 
ángulo 2 36 143.911 .000 
edad x ángulo 2 36 6.976 .003 


Obviamos la presentación de la salida con matriz NE, que obtiene una desvianza Dyg = - 140.123 
con qng = 12 parámetros (véase cuadro 10.12). El ajuste condicional de modelos obtiene una diferencia 
absoluta en desvianzas de AD = |(-140.123) — (-138.840)| = 1.283 y en parámetros de Aq=|12-8]|= 4. 
La diferencia no es estadísticamente significativa: e (4) = 1.283; P = .864, y por tanto se selecciona el 
modelo más simple, el modelo con matriz SC. Un ulterior esfuerzo de modelado buscaría un modelo 
todavía más parsimonioso que el modelo con matriz SC, que utiliza 2 parámetros de covarianza. El 
modelo con un único parámetro de covarianza (la varianza de error residual) es el modelo con matriz 
de identidad escalada (1 E), y es el que se asume en todos los diseños intersujetos. El modelo con matriz 
TE obtiene una desvianza de D¡g = —100.265 con q, = 7 parámetros (véase cuadro 10.12). La diferencia 
absoluta en desvianzas entre los modelos TE y SC es AD|(-138.840) — (-100.265)| = 38.575 y en número 
de parámetros Aq = |8— 7| = 1. La prueba de la razón de verosimilitud del ajuste condicional respecto 
del modelo con matriz SC es 0 = 38.575; P < .001, y por tanto el modelo óptimo es el modelo con 
matriz SC. Observe en el cuadro 10.12 que los criterios estadísticos A/C y BIC apuntan también que el 
mejor modelo es el modelo con matriz SC. 


CUADRO 10.12 
Resumen de los criterios estadísticos de ajuste de varios modelos 
Criterios estadísticos | Matriz NE | MatrizSC | Matriz IE 
AIC -128.123 134.840 98.265 
BIC -116.189 -130.862 96.276 
Desvianza (D) 140.123 -138.840 100.265 


Parámetros (q) 12 8 7 
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Para interpretar los resultados de los efectos fijos del modelo, objeto esencial del análisis, es nece- 
sario tener en cuenta el principio de marginalidad (puesto que la interacción es significativa) y concluir 
por tanto que el cambio producido por las diferentes inclinaciones angulares es diferente en individuos 
mayores que en individuos jóvenes F4g(2,36) = 6.976; P = .003. 

En situaciones donde la única información disponible es la magnitud de las razones F y sus gra- 
dos de libertad de numerador y denominador, puede aplicarse la Ecuación 3.35 para calcular medi- 
das de magnitud de la asociación. En concreto, la magnitud de la asociación con y? parcial para el 
efecto de la interacción AB es: e = [(2)(6.976)]/[(2) (6.976) + 36] = .279, para el efecto de B es: Me = 
[(2)043.911))/[2) (143.911) +36] = .889, y para el efecto de A es: Da = [007.270)1/10)(7.276) +18] = .288. 


10.5.2. El diseño conmutativo (DC O) 


En el contexto de la investigación longitudinal tiene especial relevancia la temporalidad en la que 
cada sujeto recibe el conjunto de los tratamientos, y particularmente los efectos de orden y periodo y los 
efectos residuales de tratamientos anteriores o efectos de transferencia (carry-over effects) que tratamos 
en los Capítulos 6 y 9. 

Hay diseños especialmente concebidos para controlar adecuadamente estos efectos (Jones y Ken- 
ward, 2003). Uno de los más comunes es el denominado DISEÑO CONMUTATIVO (cross-over design, DCO), 
que introduce la secuencia de tratamientos como un nuevo factor en el diseño. El procedimiento divide 
la muestra total de unidades experimentales en grupos a los que se asignan los tratamientos siguiendo 
un orden diferenciado (factor intersujetos). Así, si disponemos de dos tratamientos (a y b), la muestra se 
divide en dos grupos, y el primer grupo recibiría en secuencia primero el tratamiento a y después el b, 
mientras que el segundo grupo recibiría primero el tratamiento b y después el a. Si se disponen de tres 
tratamientos (a, b y c), la muestra se dividiría en 6 grupos para englobar todas las secuencias posibles, 
cada uno de los cuales recibiría los tratamientos en una de las secuencias siguientes: a— b-c, a—c-b, 
b-=a=c,b-=c-a,c-a-byc-b- a. Con tres o más medidas repetidas el número de grupos se in- 
crementa sensiblemente. Es común en tales casos reducir el número de secuencias posibles (p. ej., para 
tres tratamientos se pueden disponer de tres grupos con las secuencias ordenadas en cuadrado latino: 
a—b-—c para el grupo 1, b—-c— a para grupo 2, y c— a— b para el grupo 3. Todos estos procedimientos son 
representativos de la técnica de control denominada contraequilibración intragrupo (véase capítulo 6, 
sección 6.2.2). 

Trataremos como ilustración el caso más simple de diseño conmutativo DCO : 2x [2] con un ejemplo 
tomado de Arnau (1995d) y empleado también por Balluerka y Vergara (2002), que llamaremos ejemplo 
10.4. Se trata de un estudio sobre memoria en el que se presentan a dos grupos de 5 sujetos cada uno dos 
listas de 10 monosílabos del tipo CVC, la primera lista formada de palabras con significado (lista a) y la 
segunda con palabras sin significado pero de igual valor asociativo (lista b). Como variable de respuesta 
se utilizó la cantidad de ítems correctamente reportados. Los datos empíricos se presentan en el cuadro 
10.13 utilizando la representación multivariante. 

Es importante contemplar la naturaleza de este diseño desde la perspectiva de tres factores: la varia- 
ble grupo es la secuencia de administración de los tratamientos, la variable periodo es el orden temporal 
en que se administran los tratamientos, y la variable tratamiento es la lista recibida por cada sujeto. 
La principal ventaja del diseño DCO es que las posibles diferencias entre grupos reflejan diferencias 
en la secuencia de administración y las diferencias entre periodos reflejan diferencias en el orden de 
administración, siendo el resto del componente sistemático, o sea, el componente interactivo, el efec- 
to producido por los tratamientos (Milliken y Johnson, 2009). Nótese que el efecto de grupo compara 
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dos secuencias diferentes de administración de tratamientos y por tanto evalúa la existencia de efectos 
residuales carry-over, mientras que el efecto de periodo compara si el tratamiento que se recibe en pri- 
mer lugar difiere del que se recibe en segundo lugar. El residuo que no explican ni el efecto de grupo 
ni el efecto de periodo, o sea, la interacción grupo x periodo corresponde al efecto del tratamiento que 
interesa evaluar (a versus b). 


CUADRO 10.13 
Representación multivariante de los datos del ejemplo 10.4 


periodo 


grupo (secuencia) | sujeto 1 2 


1 (a—b) sl 7(a) | 6(b) 
1 (a—b) s2 8(a) | 6(b) 
1 (a—b) s3 6(a) | 4(b) 
1 (a—b) s4 7(a) | 5(b) 
1 (a—b) s5 8(a) | 7(b) 
2(b-a) s6 6(b) | 9(a) 
2(b-a) s7 5(0) | 7(a) 
2(b-a) s8 5(0) | 6(a) 
2(b-a) s9 7(b) | 8(a) 
2(b-a) 4(b)  6(a) 


El modelo matemático básico de este diseño es similar a un DMR 2 x [2]: 


Yiik = Mjk Sip +: 
Yijk = MRS) +aj+Pr+ lab) jr + ir (10.11) 


donde a; es un conjunto de parámetros para el factor intersujetos grupo (que refleja diferencias entre 
secuencias y evalúa por tanto al efecto carry-over), f; es un conjunto de parámetros para el factorintra- 
sujetos periodo (que refleja diferencias en el orden de administración de los tratamientos) y (a 6) ¡z es un 
conjunto de parámetros para la interacción grupox periodo (que representa el residuo no explicado por 
los efectos carry-over y de orden de administración y por tanto refleja esencialmente diferencias entre 
tratamientos). 

Las salidas 10.23 y 10.24 muestran el análisis descriptivo de los datos empíricos del ejemplo 10.4, 
separando como es usual la estructura de los tratamientos de la estructura del control. Para obtener las 
cantidades básicas y las SC correspondientes al enfoque univariante clásico puede utilizarse el proce- 
dimiento detallado en el cuadro 10.4. 


SALIDA 10.23 
Análisis descriptivo ejemplo 10.4 (estructura de los tratamientos) 


periodo 
1 


2 
1 
2 
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SALIDA 10.24 
Análisis descriptivo ejemplo 10.4 (estructura del control) 


sujeto 
sl 
s2 
s3 
s4 
Ss5 
s6 
s7 
s8 
s9 


S 


2 
2 
2 
2 
2 
2 
2 
2 
pe 
2 


89) 
o 


La figura 10.5 es un gráfico de la interacción de grupo x periodo. Obsérvese la peculiar forma cruzada 
(no ordinal) de la interacción. 


grupo 
> 1 
sho 2 


recuerdo.mean 


I I 
1.00 1.25 1.50 1.75 2.00 
periodo 


Figura 10.5. — Gráfico de la interacción grupo x periodo 
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Para un diseño mixto con 2 niveles para el factor intrasujeto no tiene ningún sentido aplicar el en- 
foque multivariante, ya que la prueba de Mauchly solo es válida para factores intrasujeto con más de 2 
niveles y por tanto no pueden definirse los criterios epsilon (e). Tampoco tiene mucho sentido aplicar 
el enfoque mixto, ya que la matriz de covarianza es 2 x 2 y por tanto hay una covarianza única, lo que 
restringe el número de matrices de covarianza que pueden probarse. No obstante, por razones didác- 
ticas aplicamos el enfoque mixto con las matrices de covarianza que son posibles, las matriz NE (que 
requiere tres parámetros aleatorios), la matriz SC (que requiere dos) y la matriz T7E (que requiere uno). 
Los parámetros de efectos fijos son, además de la constante, los efectos de grupo/secuencia, periodo y 
tratamiento. El cuadro 10.14 resume el ajuste de los tres modelos. 


CUADRO 10.14 
Resumen de los criterios estadísticos de ajuste de tres modelos 


Criterios estadísticos | Matriz NE | Matric SC | Matriz IE 
AIC 
BIC 


Desvianza (D) 


Parámetros (q) 


La comparación mediante ajuste condicional de los modelos NE y SC favorece al segundo, ya que 
1 (1) = 0.942; P = .332 y la comparación de los modelos SC e IE favorece al primero, ya que 1?(1) = 
8.173; P = .004. El modelo con matriz SC es por tanto el modelo óptimo. 

Es muy importante detenerse a interpretar los resultados (salida 10.25) para el modelo con matriz 
SC, para el que no se precisa aplicar el principio de marginalidad, dada la naturaleza de la interac- 
ción, que en el diseño DCO representa de hecho un efecto de tratamiento. Los datos apuntan que no 
hay efectos de grupo (o efectos carryover): F4(1,8) = 0.022; P = .885, ni tampoco efectos de periodo: 
Fy (1,8) = 0.200; p = .667, pero sí hay un importante efecto de tratamiento: Fag(1,8) = 57.8; P < .000, cu- 
ya naturaleza puede explorarse más detalladamente con la figura 10.5, donde para cada uno de los dos 
periodos, se representan las medias de grupo (1-2) y las medias de tratamiento (A-B). 


SALIDA 10.25 
Análisis del DMR:2x2 x [4], n= 10 con matriz SC mediante enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Simetría compuesta 23.621 47.241 (6) 51.241 52.786 
Efectos aleatorios 
Parámetros Estimador E. típico Zde Wald | P>|zl 
Varianza SC 0.250 0.125 2.000 .046 
Covarianza SC 1.000 0.566 1.767 .077 
Efectos fijos 
Fuentes de variación 8 lnum 8lden F P>F 
grupo 1 8 0.022 .885 
periodo 1 8 0.200 .667 
tratamiento 1 8 57.800 .000 
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10.5.3. El diseño doblemente multivariante 


Los diseños de medidas repetidas intrasujetos y mixtos se pueden extender también al caso multiva- 
riante, en el que se emplean dos o más variables de respuesta. Si los datos se analizan desde el enfoque 
multivariante, el resultado es el DISEÑO DOBLEMENTE MULTIVARIANTE (DDM, doubly multivariate de- 
sign). La diferencia respecto del DMR mixto original es que, además de la estructura multivariante de 
las medidas repetidas, hay otra estructura multivariante para la variable de respuesta. En tales casos, en 
lugar del ANOVA con medidas repetidas y enfoque multivariante suele aplicarse MANOVA con medidas 
repetidas y enfoque multivariante. Las alternativas analíticas del diseño DDM se exponen con mayor 
detalle en Vallejo y Menéndez (1997), Vallejo y Lozano (2008) y Vallejo, Arnau y Ato (2007). 

Un ilustrativo ejemplo del diseño DDM puede consultarse en Nuevo, Cabrera, Márquez-González y 
Montorio (2008), quienes compararon los resultados de la aplicación colectiva de dos procedimientos 
de inducción de la ansiedad en 62 estudiantes que fueron aleatoriamente asignados a dos condiciones 
experimentales de inducción de ansiedad y evaluados en dos momentos temporales (pretest-postest). 
Las variables de respuesta fueron las puntuaciones obtenidas en cuatro medidas del estado emocio- 
nal. El diseño resultante fue un DDM 2 x [2], n = 62, m = 4, donde m se refiere al número de variables 
dependientes. 


10.6. EJEMPLOS SELECCIONADOS DE LA LITERATURA 


Son muy abundantes en la literatura psicológica las investigaciones que emplean diseños de medi- 
das repetidas mixtos. Es de hecho el diseño más comúnmente encontrado. Sin embargo, es extremada- 
mente raro encontrar trabajos analizados con el enfoque mixto y muy poco frecuentes con el enfoque 
multivariante. La gran mayoría se siguen analizando con el enfoque univariante. 

Olivares, Rosa y Olivares (2009) realizaron un experimento con 59 adolescentes que presentaban 
fobia social generalizada con el objeto de aportar evidencia empírica respecto de la eficacia de la trans- 
misión de información cualificada, específica y relativa a la ansiedad en general y a la ansiedad social en 
particular, frente al tratamiento psicológico estructurado y sistemático. Los participantes se asignaron al 
azar a una de tres condiciones experimentales (tratamiento psicológico estructurado, con 20, transmi- 
sión de información cualificada, con 19, y grupo de control lista de espera, con 20 adolescentes). Todos 
los participantes completaron en tres momentos diferentes (pretest, postest y seguimiento) todos los 
instrumentos requeridos. El diseño utilizado fue un DMR mixto 3 (grupos) x [3] (momentos). Los au- 
tores enfocaron el análisis estadístico separadamente para evaluar comparaciones intersujetos e intra- 
sujeto con las medidas de respuesta aportando también medidas de tamaño del efecto. Los resultados 
apuntaron que los adolescentes que recibieron tratamiento psicológico estructurado alcanzan mejores 
resultados en las medidas de la ansiedad y de la evitación social, en los correlatos de éstas (asertividad, 
autoestima, habilidades sociales y adaptación) y en los indicadores de eficacia clínica que los que só- 
lo recibieron transmisión de información cualificada o la condición de control. También se constató la 
eficacia de la transmisión de información en la mejora de la autoestima. 

Otro trabajo de Róschke ef al. (2000) exploró la eficacia de la acupuntura aplicada adicionalmente 
al tratamiento con drogas en la depresión clínica. Con este objetivo se seleccionaron a 70 pacientes con 
trastorno depresivo que asignaron al azar a uno de tres tipos de tratamiento: acupuntura tradicional, 
acupuntura placebo y grupo de control. Los tres grupos fueron también farmacológicamente tratados 
con un antidepresivo. El grupo de acupuntura tradicional recibió acupuntura en puntos específicos con- 
siderados efectivos en el tratamiento de la depresión, el grupo de acupuntura placebo fue tratado con 
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acupuntura en localizaciones no específicas y el grupo de control sólo recibió tratamiento farmacoló- 
gico y fue clínicamente tratado como los demás grupos. Las sesiones de acupuntura se aplicaron tres 
veces por semana durante un periodo de 4 semanas. El estado de los pacientes fue evaluado por jueces 
controlados por un procedimiento ciego simple dos veces por semana durante 8 semanas. Los autores 
no encontraron diferencias entre grupos antes de comenzar el tratamiento. Se utilizó un DMR mixto 
con 3 (grupos) x [16] (momentos de medida). Para el análisis estadístico los autores recurrieron al enfo- 
que multivariante con corrección de la esfericidad mediante el criterio de Huynh-Feldt. Los resultados 
mostraron que el grupo con acupuntura tradicional mejoró algo más que el tratado farmacológicamen- 
te, aunque no se pudieron detectar diferencias significativas entre el grupo con acupuntura tradicional 
y el grupo con acupuntura placebo. 

Martínez-Sanchez y Ato (2011) se propusieron valorar la relación entre los patrones de activación 
simpática, medidos mediante la actividad electrodermal, y el nivel de alexitimia, en una situación de 
estrés experimentalmente inducida en el laboratorio. De una muestra inicial de estudiantes universita- 
rios se seleccionó una submuestra de 43 mujeres que fue clasificada en función de su nivel de alexitimia 
(alto, por encima del cuartil 75 y bajo, por debajo del cuartil 25) con las puntuaciones obtenidas en 
el TAS— 20. El experimento se planificó originalmente con tres fases (A-adaptación, después S-estrés, 
y finalmente R-relax) pero todos los participantes siguieron un proceso con seis fases repitiendo de 
nuevo la secuencia inicial (A-S-R/A-S-R) para controlar efectos de transferencia. Cinco participantes 
tuvieron que ser excluidos por no completar todo el proceso. Puesto que se observó alta heterogenei- 
dad intragrupo, la variable de respuesta empleó una transformación logarítmica. El diseño DMR mix- 
to resultante, 2 (nivel de alexitimia) x [3] (fases experimentales), se analizó con el enfoque mixto pro- 
bando hasta siete diferentes estructuras de covarianza. El mejor ajuste se obtuvo con la estructura de 
simetría compuesta. No se encontraron diferencias significativas en interacción, pero sí entre grupos: 
F(1,36) = 4.63; P = .038, y entre fases: F(2,74) = 79.54; P < .001. Estos resultados confirman parcialmente 
la hipótesis de que los alexitímicos son más reactivos fisiológicamente al estrés que los no alexitímicos. 

En un trabajo de Burgess, Grogan y Burwitz (2006), se examinó el impacto de la actividad física (dan- 
za aeróbica durante 6 semanas) sobre la insatisfacción con la imagen corporal y la autopercepción física. 
50 chicas en edad escolar de entre 13 y 14 años se asignaron al azar a una de dos condiciones de ins- 
trucción: el programa normal de educación física (PEF) y un programa de danza aeróbica (PDA), cada 
uno de los cuales tenía una duración de 6 semanas. Después de completar el primer programa, los patr- 
ticipantes cambiaron para participar en el otro programa de entrenamiento. A todas las participantes 
se les administraron dos cuestionarios sobre actitudes hacia el cuerpo y perfil autoperceptivo en tres 
momentos temporales: antes, durante y 12 semanas después de concluir el estudio. Por razones éticas, 
el diseño utilizado fue un diseño conmutativo (DCO) donde la mitad de las alumnas recibieron uno 
de los dos programas en la primera ocasión y después cambiaron al otro programa en la segunda, de 
tal forma que el primer grupo recibió los programas en el orden PEF— PDA y el segundo en el orden 
PDA-— PDF (contraequilibración intrasujeto). Los investigadores examinaron primero la equivalencia 
de los grupos y después aplicaron el enfoque univariante al ANOVA mixto 2 (grupo) x [3] (momento) 
resultante. Para el conjunto de las medidas, un MANOVA encontró una interacción grupo por momen- 
to: F(2,96) = 5.92;P < .05. Para otras medidas, el ANOVA encontró también efectos de interacción en 
prácticamente todos los casos. 

Los trabajos anteriores utilizan diseños factoriales muy simples. Casos más complejos, pero más 
inusuales, del DMR mixto pueden consultarse en Conchillo, Hernández, Recarte y Ruiz (2000), que es- 
tudiaron las funciones psicofísicas de la velocidad con un diseño 2x2x[2x2] contraequilibrando los 
niveles de los dos factores intrasujeto, y Martínez, Gomes, Mojardín-Heráldez y Stein (2012), que explo- 
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raron el impacto del efecto de generación sobre las memorias verdaderas y las falsas memorias con un 
diseño 2x2x[3x2x2]. 


10.7. SUGERENCIAS DE ESTUDIO 


El diseño de medidas repetidas mixto tiene la misma estructura que el diseño de medidas totalmente 
repetidas, con excepción de la inclusión de al menos un factor intersujetos. Por esta razón, todas las 
sugerencias de estudio que se apuntaron en el capítulo 9 se aplican también al capítulo 10. 

Además de las referencias citadas en el capítulo 9, son también recomendables en este contexto una 
monografía de Verbeke y Mollenberghs (2000) y, en español, la colección de trabajos coordinados por 
el profesor Arnau, fundamentalmente el volumen dedicado al diseño longitudinal (1995), que trata en 
detalle los diseños de parcela dividida y el diseño conmutativo, y en menor medida el volumen dedi- 
cado a los diseños de series temporales (2001). Un tratamiento de las alternativas analíticas basadas en 
técnicas de aleatorización con remuestreo "bootstrap' puede consultarse en Vallejo, Cuesta, Fernández 
y Herrero (2006) y Vallejo, Fernández, Tuero y Livacic-Rojas (2010). 

La referencia más completa de que disponemos sobre los diseños de parcela dividida es la de Federer 
y King (2006). Los diseños conmutativos se tratan muy bien en Jones y Kenward (2003). Los problemas 
analíticos del diseño doblemente multivariante pueden consultarse en Vallejo y Lozano (2008). 
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11.1. INTRODUCCIÓN 


Como tratamos en el capítulo 6, el diseño experimental típico posee dos características distintivas 
esenciales: 


— la manipulación activa de (al menos) una variable explicativa; 


— el uso de una regla de asignación aleatoria para repartir las unidades experimentales entre las 
combinaciones de tratamiento de uno o más factores, evitando así la presencia de sesgos. 


La regla de asignación aleatoria puede ser completa o restringida, en función de que la asignación 
de unidades a tratamientos se realice directamente, de unidad experimental a tratamiento, o bien se 
utilice primero una (o más) variable(s) de clasificación para hacer más homogénea la respuesta de las 
unidades experimentales a los tratamientos. En el primer caso, se obtienen los DC A; en el segundo, los 
DBA. El máximo grado de homogeneidad se obtiene cuando se utiliza una única unidad experimental 
en un nivel de la variable de bloqueo, en cuyo caso el resultado son los DMR. El empleo de una regla 
de asignación aleatoria es posible en los diseños DP D, pero es más complicado en DMR, sobre todo si 
algunos tratamientos se administran siguiendo un orden temporal. De ahí que la presencia de efectos 
de secuenciación y de efectos residuales de tratamientos anteriores (carry over effects) deban ser objeto 
específico de control por parte del investigador. 

Las características que requiere el empleo del diseño experimental (manipulación y regla de asigna- 
ción aleatoria) solamente se cumplen bajo las condiciones restringidas del experimento de laboratorio. 
Pero la investigación experimental es muy restrictiva, particularmente en lo que concierne a la segunda 
de las características. Son numerosas las situaciones donde no es posible, o no es ético, asignar unidades 
experimentales a tratamientos al azar, y donde no es por tanto posible utilizar un diseño experimental. 
Es por ello por lo que desde los años 60 se ha desarrollado una nueva metodología de investigación 
que intenta reproducir en contextos naturales las condiciones del experimento de laboratorio, pero ex- 
cluyendo precisamente su característica esencial, la asignación aleatoria de unidades experimentales 
a tratamientos (Campbell y Stanley, 1966), y por esta razón se conoce también como experimento de 
campo (Shadish y Cook, 2009). 
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Los diseños que sustentan la metodología de los experimentos de campo se denominan genérica- 
mente DISEÑOS CUASIEXPERIMENTALES, y se han aplicado en situaciones donde la utilización de un di- 
seño experimental hubiera sido deseable si se hubiera podido emplear la asignación aleatoria. Pero para 
compensar la ausencia de aleatorización, esta nueva metodología ha introducido otras formas de con- 
trol tanto estadístico (p. ej., el uso de covariantes y las puntuaciones de propensión) como experimental 
(p. ej., la definición de medidas antes —pretest— y después —postest— del tratamiento, o la introducción 
de uno o más grupos de control). Una de las más importantes áreas de aplicación ha sido la evalua- 
ción de PROGRAMAS DE INTERVENCIÓN SOCIAL (Chacón, Anguera, Sanduvete y Sánchez-Martín, 2014), 
Fernández-Ballesteros, 1995; Judd y Kenny, 1981a; Rebolloso, Fernández-Ramírez y Cantón, 2008). Pero 
tal y como hoy la conocemos, la metodología cuasiexperimental se aplica en muchos y muy variados 
contextos de la investigación psicológica, clínica, educativa y social (Shadish y Luellen, 2006). 

Lo que diseños experimentales y cuasiexperimentales tienen en común es la manipulación de (al 
menos) una variable independiente mediante la utilización de una VARIABLE DE ASIGNACIÓN, una varia- 
ble relacionada con la variable de respuesta y responsable de asignar tratamientos a unidades experi- 
mentales aplicando alguna REGLA DE ASIGNACIÓN. En el caso más simple las unidades experimentales 
pertenecen a un grupo que recibe tratamiento (Grupo Experimental o GE) y otro grupo que no lo recibe 
(Grupo de Control o GC), pero la asignación no es aleatoria. Como tratamos en el capítulo 6, las tres 
formas básicas que puede adoptar una regla de asignación son: 


— Aleatoria (A): las unidades se asignan al azar a los grupos (GE o GC). Se asume que los sujetos son 
iguales antes de que el programa se administre y, si el programa no es muy duradero, es esperable 
que su impacto sólo pueda atribuirse al programa, excluyendo otras explicaciones alternativas. 


— No aleatoria, pero sí conocida (NAC): las unidades se asignan al GE o al GC en base a las pun- 
tuaciones obtenidas en la misma medida (pretest) con la que se medirá al final el impacto del 
programa (postest). En esta situación, dentro de los límites del error de medida y otros supuestos 
estadísticos, es posible atribuir el impacto del programa al programa mismo. 


— No aleatoria, ni conocida (NA): no se conoce exactamente la naturaleza de la variable de asigna- 
ción mediante la cual se distribuyen las unidades. En este caso el presumible impacto del progra- 
ma puede ser problemático atribuirlo al programa, ya que se genera una situación de confundido 
que requiere especial atención por parte del evaluador. El confundido obliga al investigador a ana- 
lizar con más detalle las posibles variables extrañas que podrían explicar los resultados obtenidos. 
A este respecto, las amenazas contra la validez interna son especialmente aplicables aquí. 


11.1.1. Tipología 


Se suele distinguir entre dos grandes grupos de diseños cuasiexperimentales, que se diferencian 
entre sí por la secuencia de registro de las observaciones previa y posterior a la introducción de algún 
tratamiento o programa de intervención en un grupo, pero no en otro. 


1. El primer grupo de diseños cuasiexperimentales son los DISEÑOS DE GRUPO PRETEST-POSTEST, 
que se caracterizan porque tienen entre sus ingredientes básicos la existencia de una medida pre- 
via a la intervención (pretest), y una medida posterior a la intervención (postest), que refleja el 
efecto del programa, y/o una variable de asignación que determina la pertenencia al GE, al que 
se administra el programa, o al grupo de control (GC), al que no se le administra. Hay dos diseños 
básicos de grupo pretest-postest, a saber: 
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— El DISEÑO CON GRUPO DE CONTROLNO EQUIVALENTE (DGNE,) es el diseño cuasiexperimental 
prototípico, caracterizado por el uso de una variable de asignación no aleatoria ni conocida, 
dos grupos (GE y GC) y dos medidas (pretest y postest). 


— El DISEÑO DE DISCONTINUIDAD DE LA REGRESIÓN (DDR) representa un diseño de similares 
características al DGNE donde se utiliza una variable de asignación no aleatoria pero sí co- 
nocida. 


El segundo grupo de diseños cuasiexperimentales son los DISEÑOS DE SERIES TEMPORALES IN- 
TERRUMPIDAS, cuya característica fundamental es el registro de múltiples medidas previas y de 
múltiples medidas posteriores a la introducción de un programa de intervención. Cabe distinguir 
a su vez dos formas alternativas, que difieren entre sí en función del número de grupos utilizados: 


— el DISEÑO SIMPLE DE SERIES TEMPORALES INTERRUMPIDAS (DST 1) utiliza un solo grupo (GU); 


— el DISEÑO DE SERIES TEMPORALES INTERRUMPIDAS CON GRUPO DE CONTROL NO EQUIVALENTE 
(DSTIC) utiliza el diseño DSTI con dos grupos: un grupo experimental (GE) y un grupo de 
control (GC). 


Puesto que la disponibilidad de al menos dos grupos y dos medidas no siempre es posible, suele 
distinguirse (véase Shadish et al., 2002, p. 103-134) un grupo de diseños de grupo pretest-postest, a 
veces también llamados DISEÑOS PREEXPERIMENTALES (Cook y Campbell, 1979), donde falta alguno de 
los ingredientes clave (o bien un grupo de control o bien una medida pretest, o los dos). Algunos de estos 
diseños se tratan en este texto como variaciones del diseño DGNE siempre que utilicen una variable 
manipulada. En caso contrario serán considerados dentro de la estrategia asociativa y tratados como 
diseños comparativos (véase capítulo 13) . 


11.1.2. Notación 


Todo diseño cuasiexperimental puede esquematizarse bajo la forma de un diagrama que identifica 
varios aspectos de interés para valorarlo. Cada diagrama incluye: 


El número de grupos, y más concretamente si es único (en general considerado como un grupo 
experimental, al que se le administra un programa de tratamiento) o si son múltiples grupos, en 
cuyo caso se requiere la especificación de los grupos. La situación más común distingue entre un 
grupo experimental (GE) y un grupo control (GC). 


La variable de asignación que se utiliza: si no existe asignación (NE), porque se trata de un grupo 
único, si es aleatoria (4), no aleatoria pero conocida (NAC) o no aleatoria ni conocida (VA). 


El tratamiento o programa (T) que se emplea, que representa la variable explicativa. En ocasio- 
nes, el diseño también puede incorporar una o más covariantes, que se emplean con propósitos 
específicos. 


Y finalmente, la variable de respuesta (Y), que puede medirse en una ocasión o más de una; en 
tales casos utilizamos un dígito para especificar la ocasión de medida (1, 2, 3, etc.). El caso más 
general es una medida pretest (Y1) y una medida postest (Y2). En evaluación de programas no 
suele haber una, sino múltiples variables de respuesta, que se distinguen entre sí por el uso de 
subíndices (Ya, Yp, etc). 


Utilizamos esta notación para ilustrar los ejemplos de los diseños tratados en este capítulo. 
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11.2, DISEÑO CON GRUPO CONTROL NO EQUIVALENTE 


11.2.1. Introducción 


El diseño cuasiexperimental por excelencia es el DISEÑO CON GRUPO CONTROL NO EQUIVALENTE 
(DGNE). En su forma más básica, consta de un GE, que recibe algún tipo de tratamiento o programa, 
y un GC no tratado y sus unidades experimentales son evaluadas con el mismo instrumento de medida 
en dos ocasiones en el tiempo: un pretest, antes de administrar el tratamiento, y un postest, después 
de su administración, pero la asignación a grupo es no aleatoria (NA). La estructura de este diseño es 
similar al DMR mixto y se expone en el cuadro 11.1. 


CUADRO 11.1 
Diseño con grupo control no equivalente (DGNE) 


Asignación | Pretest | Programa | Postest 
NA Y T Y, 


NA Ya = Ya 


Como consecuencia de no utilizar una regla de asociación aleatoria, el problema esencial del diseño 
DGNE es que, en ausencia de efectos de tratamiento, GE y GC no obtienen puntuaciones equivalentes 
en el postest (sesgo de selección). Con la finalidad de evaluar la no equivalencia y permitir el uso de algún 
tipo de ajuste estadístico para equilibrar los grupos se toman medidas pretest. 

La inferencia causal en un diseño con grupo control no equivalente depende del resultado obtenido 
y de la posibilidad de eliminar la influencia de variables extrañas, particularmente las asociadas con 
validez interna, y más concretamente, historia, maduración, regresión estadística e instrumentación 
(véase cuadro 6.6). Cook y Campbell (1979) y Shadish et al. (2002) han destacado cinco diferentes pautas 
de resultados de las que depende la calidad de la inferencia causal que se muestran en la figura 11.1. 


1. GE y GC cambian en la misma dirección pero a diferente ritmo (figura superior derecha). No es 
posible eliminar la influencia de ninguna de las variables extrañas. Los efectos de historia y/o de 
maduración física o psicológica que tienen lugar diferencialmente en uno de los grupos pueden 
ser responsables de las diferencias en la trayectoria seguida por los grupos. Del mismo modo, el 
efecto de regresión estadística puede producirse en el GC debido a que son más bajos los valores 
de partida de la escala. Y finalmente, el efecto de instrumentación puede deberse al hecho de que 
GE y GC parten de puntuaciones diferentes en el pretest. 


2. No hay cambio en GC (figura superior izquierda). La atribución causal con esta pauta es bastante 
mejor puesto que puede eliminarse la influencia de muchas variables extrañas, al no presentarse 
cambios en el GC. 


3. Las diferencias en el pretest disminuyen en el postest (figura central). La situación es similar a la an- 
terior, donde es posible eliminar la influencia de la maduración, pero la influencia de la regresión 
estadística es relevante, sobre todo si el GE parte de puntuaciones muy extremas (efecto techo). 


4. GE en tratamiento compensatorio con interacción ordinal (figura inferior izquierda). Esta pauta 
es similar a la anterior, pero aparece cuando el GE experimenta programas de educación com- 
pensatoria. La influencia de la regresión estadística es máxima en este caso, sobre todo si el GE 
parte de puntuaciones muy extremas (efecto suelo). Lo mismo cabe decir de la influencia de la 
instrumentación, que en este caso es también máxima. 
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Figura 11.1. — Pautas de resultados para un diseño con grupo control no equivalente. 


5. GE en tratamiento compensatorio con interacción no ordinal (figura inferior derecha). Esta pauta 
es la más conveniente de todas. Permite eliminar la influencia de la maduración, la regresión es- 
tadística y la instrumentación, aunque subsiste el efecto de la historia, que no es posible eliminar 
en ninguno de los casos citados. 


A la vista de estas pautas, la formación de los dos grupos en este diseño adquiere una importancia 
crucial y permite distinguir entre diferentes formas de diseño. Judd y Kenny (1981a, pp. 102-103) apun- 
tan varios procedimientos para configurar los grupos: 


— El más sencillo consiste en utilizar grupos naturales, es decir, grupos que ya se han formado antes 
de comenzar la investigación. Los diseños que utilizan grupos naturales se consideran en este 
texto como diseños comparativos (estrategia asociativa), porque no cumplen con la condición 
básica de variable manipulada de todo diseño cuasiexperimental, y serán tratados más adelante. 


— Más usual es hacer un esfuerzo por asegurar que el GC sea aproximadamente equivalente al GE, 
por lo general mediante alguna forma de emparejamiento sobre variables relevantes, y en la medi- 
da de lo posible, basado en puntuaciones de propensión (véase capítulo 6). La forma más básica 
es el emparejamiento individual de unidades experimentales, que consiste en elegir, para cada 
unidad de un grupo, una unidad de similares características en un conjunto de variables (p. ej., 
inteligencia, edad, motivación, actitud, perfil psicopatológico, etc.) para el otro grupo. 
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— Otro procedimiento consiste en disponer de un amplio número de sujetos para participar en un 
programa, de donde se selecciona un grupo de voluntarios (GE) y el resto forma el GC. Esta solu- 
ción se adoptó en una investigación de Zamarrón, Tárraga y Fernández-Ballesteros (2008). 


— Una última solución examina las unidades sometidas a tratamiento y compara unidades con alta 
exposición al tratamiento contra unidades con baja exposición. Este enfoque es útil en investiga- 
ciones donde tarde o temprano todas las unidades terminan recibiendo el tratamiento. 


11.2.2. Alternativas de análisis estadístico 


Para desarrollar las opciones analíticas del diseño con grupo control no equivalente utilizaremos un 
ejemplo ficticio (ejemplo 11.1) cuyos datos se han obtenido mediante procedimientos de simulación 
que nos aproximen datos reales. Se han generado un total de 60 observaciones de una variable pretest 
medida sobre una escala de 1 a 15 puntos, y 60 observaciones de una variable postest, que han sido 
incrementadas en una cantidad positiva aleatoria respecto a la variable pretest. Se asignaron las pun- 
tuaciones generadas al azar a uno de dos grupos, un grupo experimental (GE), al que se asume que se 
le administró un tratamiento, y un grupo de control (GC), al que no se le administró, pero en el pretest 
se mantuvo una diferencia entre GE y GC. La matriz de datos se muestra en el cuadro 11.2. 


CUADRO 11.2 
Datos empíricos del ejemplo 11.1 


Caso | pret | post | grupo “=. | Caso pret | post | grupo “=. | Caso pret | post | grupo 
1 10 15 GE 21 6 13 GE 41 11 14 GC 
2 8 13 GE 22 11 15 GE 42 6 8 GC 
3 9 16 GE 23 7 14 GE 43 7 YL GC 
4 13 15 GE 24 10 17 GE 44 12 14 GC 
5 10 17 GE 25 8 16 GE 45 8 10 GC 
6 14 18 GE 26 8 15 GE 46 12 13 GC 
7 13 18 GE 27 11 13 GE 47 6 7 GC 
8 8 12 GE 28 11 17 GE 48 9 11 GC 
9 12 17 GE 29 12 16 GE 49 5 9 GC 
10 8 14 GE 30 11 16 GE 50 7 9 GC 
11 14 17 GE 31 4 8 GC 51 11 11 GC 
12 9 13 GE 32 11 10 GC 52 6 9 GC 
13 10 14 GE 33 10 12 GC 53 6 12 GC 
14 13 17 GE 34 12 12 GC 54 9 12 GC 
15 9 15 GE 35 13 14 GC 55 10 10 GC 
16 13 16 GE 36 9 14 GC 56 9 10 GC 
17 12 18 GE 37 6 11 GC 57 10 11 GC 
18 9 16 GE 38 10 13 GC 58 7 10 GC 
19 10 16 GE 39 12 11 GC 59 8 11 GC 

20 7 13 GE 40 12 15 GC 60 7 12 GC 


La salida 11.1 presenta el análisis descriptivo de los datos. Nótese que las medias del postest son su- 
periores a la medias del pretest y que las medias del GE son también superiores a las del GC. Además, las 
varianzas de cada grupo parecen presentar una alta homogeneidad, lo que permite descartar la presen- 
cia de heterocedasticidad. De hecho, la prueba de Levene no fue significativa: F(1,58) = 0.262; P =.611. 
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SALIDA 11.1 
Análisis descriptivo de los datos del ejemplo 11.1 
Grupo Experimental (GE) Grupo Control (GC) 
Medida | Media | Suma Varianza Media | Suma Varianza 
pretest 10.200 | 306.000 4.855 8.833 265.000 6.213 


postest | 15.409 | 462.000 2.938 11.133 | 334.000 3.982 
Total 9.517 571.000 5.915 13.267 | 796.000 8.029 


El análisis de los datos de un DGNE es más complicado que el de un diseño DVC, debido a la ne- 
cesidad de compensar la falta de equivalencia de grupos y la utilización de procedimientos de ajuste 
estadístico (Achen, 1986; Ato, 1995b; Bonate, 2000; Dimitrov y Rumrill, 2003). Como consecuencia, ha 
sido un tema muy controvertido que se ha abordado desde muchas perspectivas, pero las más utilizadas 
son cuatro: 1) ANOVA con las puntuaciones del postest; 2) ANOVA para un DMR mixto; 3) ANCOVA con 
el pretest como covariante y 4) ANOVA con puntuaciones de cambio. 

La figura 11.2 delimita dos nubes de puntos correspondientes a los dos grupos (GC, etiquetado con 
"0 y GE, etiquetado con *1”), donde, con excepción de algún punto que se solapa, es perfectamente 
perceptible la separación de las puntuaciones de ambos grupos. 


postest 


pretest 


Figura 11.2. — Delimitación de las puntuaciones de GE y GC. 


El análisis más simple sería emplear ANOVA tomando las puntuaciones en el postest como variable 
de respuesta y las puntuaciones de grupo como variable explicativa, o sea, Y;¡= + a+ e;j;, de forma 
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similar al análisis para un diseño completamente aleatorio. Pero la aplicación de ANOVA en un sentido 
sólo puede justificarse cuando los grupos son realmente equivalentes (o sea, cuando no hay diferencias 
estadísticamente significativas entre los grupos en el pretest) y por tanto el análisis requiere la previa 
comprobación de la equivalencia de los grupos en el pretest. Tomando el pretest como variable de res- 
puesta, con los datos empíricos del ejemplo 11.1, el correspondiente ANOVA demuestra que los grupos 
no son equivalentes en el pretest: F(1,58) = 5.063; P = .028, y por tanto no procede para este ejemplo 
aplicar ANOVA con las puntuaciones del postest. 


Otra opción analítica consiste en utilizar ANOVA para un DMR mixto (medidas parcialmente repe- 
tidas). En este análisis, la variable intersujetos es grupo, con 2 niveles (GE y GC), y la variable intrasujeto 
es la ocasión de medida prepost, también con 2 niveles, medida 1 (pretest) y medida 2 (postest). La ven- 
taja de esta opción es que los efectos fijos (grupo y prepost) se prueban con mayor precisión debido a 
la descomposición del error. La principal desventaja es que no es posible utilizar procedimientos para 
equilibrar la administración de las medidas repetidas, debido a que el pretest debe preceder en el tiempo 
al postest. Y finalmente, al disponer de un grado de libertad para el factor intrasujetos los resultados son 
similares, independientemente del enfoque que se utilice (univariante, multivariante o mixto), como 
tratamos en el capítulo anterior. La salida 11.2 resume los resultados obtenidos con el enfoque mixto, 
mostrando diferencias estadísticamente significativas en el factor grupo, en el momento de la medida 
prepost y en la interacción entre ambas variables grupo x prepost. 


SALIDA 11.2 


Análisis del diseño con grupo control no equivalente con un DMR:2 x [2] 


Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Simetría compuesta 240.9 481.8 (6) 485.8 491.307 
Efectos aleatorios 

Parámetros Estimador E. típico Zde Wald | P>|zl 
Varianza SC 1.458 0.271 5.385 .000 
Covarianza SC 3.039 0.713 4.264 .000 

Efectos fijos 

Fuentes de variación 8lnum 8lden F P>F 
grupo 1 58 31.583 .000 
prepost 1 58 289.400 .000 
grupo x prepost 1 58 43.268 .000 


La figura 11.3 muestra el gráfico de la interacción, que como se puede apreciar es de naturaleza 
ordinal. La presencia de una interacción significativa en el ANOVA mixto significa que los grupos no 
presentan una trayectoria paralela. Este es el único resultado interpretable, como propugna el principio 
de marginalidad, porque prueba si las diferencias entre grupos son similares en el pretest y en el postest. 
Pero el efecto de grupo no es interpretable porque se refiere al promedio de las dos ocasiones de medida 
y el efecto de las ocasiones de medida tampoco es interpretable porque se refiere al promedio de los 
grupos. Esta es la razón por la que muchos investigadores no recomiendan utilizar este tipo de análisis 
para el diseño con grupo control no equivalente (véase Huck y McLean, 1975; Jennings, 1988). 
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Figura 11.3. — Gráfico de la interacción grupox prepost. 


Una tercera opción analítica es el ANCOVA tomando el pretestcomo covariante y grupo como factor 
de tratamiento. Como sabemos, el análisis de covarianza requiere el cumplimiento del supuesto de pa- 
ralelismo (u homogeneidad) de las pendientes de regresión. Siguiendo el procedimiento de las etapas de 
modelado de Milliken y Johnson (véase capítulo 5), en la primera etapa la interacción grupo x pretestes 
significativa por lo que la hipótesis de pendientes nulas resulta rechazada: Fgp(2,56) = 26.115; P <.001, 
y en la segunda etapa, la interacción grupo x pretest no es significativa por lo que la hipótesis de pen- 
dientes paralelas es aceptada: Fgp (1,56) = 0.020, P = .887. El submodelo ANCOVA con pendientes para- 
lelas se muestra en las salidas 11.3 (para los estimadores de los parámetros) y 11.4 (para la descomposi- 
ción de la variación). De acuerdo con esta última salida las diferencias entre GE y GC, una vez contro- 
lado el efecto del pretest, son estadísticamente significativas: F(1,57) = 96.801; P = .000. La pendiente 
común ($ R = .549), es significativamente diferente de cero, y el valor de la intersección de la recta de 
regresión para el grupo de control (o sea, el grupo que se toma como referencia) es fo(GC) = 6.282. La 
diferencia entre las pendientes de GC y GE se estima en br = 3.516 puntos de la escala del postest, y 
por tanto el valor de la intersección de la recta de regresión para el grupo experimental es $p(GE) = 
6.282 + 3.516 = 9.798. Finalmente, el efecto de tratamiento, o sea, la diferencia entre GE y GC, se evalúa 
para el valor medio del pretest y es de $] = 3.516. La magnitud del efecto de tratamiento puede obtener- 
se empleando la fórmula de wa partir de las F empíricas: 0 = 93.601/(93.601 + 53.123 + 60) = 0.452, 
que representa una magnitud alta en la escala de Cohen. 
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SALIDA 11.3 
Estimación de parámetros del submodelo ANCOVA con pendientes paralelas 


Variable dependiente: rend 


Límites IC 95% 

Parámetro Inferior | Superior 
Constante ; 4.861 7.704 
grupo=GE . 2.788 4.244 
pretest ; 0.398 0.700 


SALIDA 11.4 
Ajuste del submodelo ANCOVA con pendientes paralelas 
Variable dependiente: rend 
Fuente | SC tipo III MC F 
Modelo 369.868 184.934 | 101.489 
grupo 170.560 1 | 170.560 93.601 


pretest 96.801 96.801 53.123 
Residual 103.866 1.822 
Total 473.733 


Un problema que ha suscitado debate en relación con el uso del ANCOVA para analizar los datos 
del diseño con grupo control no equivalente son las diferencias que los grupos presentan en el pretest. 
El modelo ANCOVA asume que las puntuaciones del pretest no están afectadas por error de medida. 
Pero está demostrado que la presencia de error de medida en el pretest puede generar estimaciones 
sesgadas (véase Trochim, 2006; Huitema, 2011). Una forma consensuada de ajustar del error de medida 
en el pretest consiste en ajustar las puntuaciones del pretest (X¿¿) mediante 


Xaj=X+R(X-X) (11.1) 


En esta ecuación, X son las puntuaciones el pretest y R es el coeficiente de fiabilidad (R, Reliability), 
donde valores de R= 1 se asocian con fiabilidad perfecta y valores de R = 0 con falta de fiabilidad. Para 
obtener el coeficiente de fiabilidad de la medida del pretest se generaron mediante remuestreo bootstrap 
1000 muestras aleatorias con 60 casos cada una tomadas de los datos originales y se obtuvieron para 
cada muestra sendas medidas de fiabilidad por el método de las mitades. El valor medio de fiabilidad de 
las 1000 muestras fue de R = 0.648, a partir del cual se obtuvieron nuevos valores de pretest ajustados 
por la falta de fiabilidad aplicando la ecuación 11.1. La media global de los valores de pretest ajustados 
fue la misma, Xa ¡=9.517 (véase salida 11.1), pero su varianza fue mucho menor, S KE 2.484. Un nuevo 
ANCOVA con los valores del pretest ajustado produjo valores prácticamente similares a los de la salida 
11.3, pocos cambios en la constante, Bo(GE) = 6.956, y ningún cambio en el efecto de tratamiento Br = 
3.516, pero un sensible aumento de la pendiente común: $g = 0.847 respecto de la salida 11.3. 

Las medias ajustadas del ANCOVA pueden obtenerse también con facilidad utilizando la fórmula 
clásica (ecuación 5.5 del capítulo 5) o los estimadores ajustados de la falta de fiabilidad y aplicando: 


EE = 
Y ¡=Y¡- Br(Xa¡-Xaj)» (11.2) 
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donde X¿¡ se refiere a los valores de la covariante corregidos de falta de fiabilidad y Br = 0.847 es la 
pendiente de regresión común corregida. En concreto, los promedios ajustados fueron, para GE: E E= 
15.400 — (0.847) (9.960 — 9.517) = 15.025 y para GC: Ve = 11.133 -— (0.847)(9.074-— 9.517) = 11.508. 

El modelo causal que confiere sentido sustantivo al procedimiento ANCOVA para el análisis de datos 
de un DGNE es el MODELO MEDIACIONAL (Judd y Kenny, 1981a), que se representa en la figura 11.4. Se 
llama así porque el efecto que la variable de asignación (no aleatoria ni conocida) tiene sobre el postest 
no es directo, sino mediado por el pretest y por el efecto de tratamiento (si existe, como sucede en el 
ejemplo 11.1). Toda la varianza que la variable de asignación comparte con el postest se controla al 
incorporar como predictores en el modelo el pretest y el tratamiento (pertenencia a GE o GC). Si el 
modelo se cumple, no es preciso conocer la variable de asignación para obtener resultados válidos. Sólo 
si es válido el modelo mediacional, los resultados del ANCOVA serán correctos. 


PRETEST 


VARIABLE 
DE 
ASIGNACIÓN 


POSTEST 


TRATAMIENTO 


Figura 11.4. — Modelo mediacional. 


En el modelo mediacional el efecto de la variable de asignación sobre el postest está mediado por el 
pretest, es decir, las puntuaciones que los sujetos obtienen en el postest pueden ser explicadas directa- 
mente por las diferencias entre grupos, e indirectamente por las diferencias iniciales en el pretest. Un 
modelo alternativo es el MODELO DE CAMBIO (figura 11.5), que considera que la variable de asignación 
afecta directamente a pretest y postest, pero el pretest no afecta directamente al postest. Es decir, las 
puntuaciones en el postest no se explican por el pretest, sino por las diferencias de tratamiento y por 
el efecto de la variable de asignación, efecto que se supone de igual magnitud para pretest y postest 
(supuesto de ESTACIONARIEDAD). 


PRETEST 


VARIABLE 
DE 
ASIGNACIÓN 


POSTEST 


TRATAMIENTO 


Figura 11.5. — Modelo de cambio. 
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El análisis estadístico que subyace al modelo de cambio constituye otra opción analítica para el 
diseño con grupo control no equivalente, consistente en utilizar las PUNTUACIONES DE CAMBIO (change 
scores), que son simplemente las diferencias entre postest y pretest (d = Y post — Yprer). Si se toma como 
variable de respuesta las puntuaciones de cambio, entonces el efecto de tratamiento es el cambio medio 
entre GE y GC en lugar de las diferencias entre las medias ajustadas como en el ANCOVA. La escala de 
medida cambia la naturaleza de la variable de respuesta a una nueva variable donde el cambio nulo es 
el valor cero (d = 0), y donde pueden darse tanto valores negativos (d < 0) como positivos (d > 0). Este 
análisis se presenta en la salida 11.5 y muestra también que existen diferencias significativas entre GE y 
GC (Allison, 1990). 


SALIDA 11.5 
ANOVA con puntuaciones de cambio como variable de respuesta 


Variable dependiente: d 
Fuente | SC tipo lII MC 
Modelo 126.500 126.500 
grupo 126.500 126.500 


Residual 169.100 2.196 
Total 295.250 


El análisis con puntuaciones de cambio tiene una relación directa con el ANOVA para el DMR mixto 
(salida 11.2). Nótese que el valor de F y la probabilidad obtenidos utilizando ANOVA con las puntuacio- 
nes de cambio, F(1,58) = 43.268; P = .000 son exactamente iguales a los obtenidos para la interacción 
prepost x grupo en el ANOVA mixto de la salida 11.2, lo que demuestra que el efecto de grupo del ANOVA 
con puntuaciones de cambio es en esencia el componente de interacción del ANOVA mixto, y como 
apuntamos más arriba, el único efecto interpretable en aplicación del principio de marginalidad. 

El análisis de varianza con las puntuaciones de cambio es un enfoque válido para analizar los datos 
del diseño con grupo control no equivalente siempre que se verifique el cumplimiento del modelo de 
cambio de la figura 11.5. El modelo requiere además el cumplimiento de otras condiciones adicionales 
para hacer justificable el análisis, en concreto: 


— el supuesto de estacionariedad, que implica la existencia de tasas de crecimiento constantes (de 
ahí la importancia de usar variables de asignación estables); 


— tal y como muestra la figura 11.5, es obvio que la variable de asignación causa el pretest y que pre- 
test y postest son independientes, pero no es posible que el pretest cause la variable de asignación, 
como en el modelo mediacional, porque entonces no se cumpliría el supuesto de estacionariedad; 


— y finalmente, pretest y postest deben necesariamente registrarse en la misma unidad de medida. 


Zamarrón et al. (2008) utilizaron el diseño DGNE para evaluar los cambios en plasticidad cognitiva 
tras entrenamientos de psicoestimulación en enfermos de Alzheimer en fase leve. Se emplearon 26 pa- 
cientes con Alzheimer, 17 de los cuales seguían un programa de estimulación cognitiva durante 6 meses 
y los otros 9 fueron asignados al grupo de control. Todos ellos fueron evaluados con tres subtests de la 
Batería de Evaluación del Potencial de Aprendizaje (BEPAD), antes y después de la administración del 
tratamiento (pretest y postest). Los datos se analizaron con £ de Student y ANOVA con puntuaciones 
de cambio. Los resultados pusieron de manifiesto que el entrenamiento cognitivo realizado puede efi- 
cazmente incrementar la plasticidad cognitiva en pacientes con enfermedad de Alzheimer en fase leve, 
en tareas de memoria viso-espacial, audio-verbal y en fluidez verbal, y que los pacientes que no son 
tratados disminuyen su plasticidad cognitiva. 
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11.2.f3. Variaciones del diseño con grupo control no equivalente 


El diseño DGNE es el diseño cuasiexperimental más frecuentemente encontrado en la literatura 
psicológica, por la facilidad de trabajar con grupos que no requieren aleatorización, pero también por 
su gran flexibilidad. El diseño puede incluir más de un grupo de control, o varios grupos de tratamiento, 
y disponer de más de una medida postest (usualmente, postest y seguimiento), y también de más de 
una medida pretest. Hasta cierto punto, estas variaciones representan la superación de alguno/s de sus 
problemas interpretativos y la capacidad de adaptarse a las circunstancias de la investigación. 


— El DISEÑO DGNE CON DOBLE PRETEST se justifica cuando ciertos sesgos que aparecen en compa- 
raciones intrasujeto pueden ser relevantes, particularmente la interacción selección-maduración 
O la interacción selección-historia. Su estructura, que se presenta en el cuadro 11.3, es analítica- 
mente similar al DISEÑO DGNE CON DOBLE POSTTEST (véase Rausch, Maxwell y Kelley, 2003). 


CUADRO 11.3 
DGNE con doble pretest 


Asignación | Pretest 
NA YE1) YE1 


NA Yc1, Yc1 


En un trabajo de Franco (2006) se exploró la relación existente entre los factores afectivos y la 
capacidad creativa, planteando como hipótesis si la expresión de la capacidad creativa redunda 
de forma positiva en la manifestación del autoconcepto. Con esta finalidad, se diseñó un progra- 
ma psicoeducativo, basado en cuentos infantiles, dirigido a incrementar la capacidad creativa en 
una muestra de educación infantil, con el objetivo de obtener una mejora en la expresión de su 
autoconcepto. Se utilizó el diseño cuasiexperimental con grupo control no equivalente y doble 
pretest. Como instrumentos de evaluación se utilizaron la Batería Verbal del Test de Pensamiento 
Creativo de Torrance y el PAI (Percepción del Autoconcepto Infantil) de Villa y Azumendi. Los re- 
sultados de la investigación arrojaron incrementos significativos en el grupo experimental, tanto 
en los niveles de creatividad verbal (fluidez, flexibilidad y originalidad), como en los niveles de 
autoconcepto, en relación con los grupos de control. 


— El DISEÑO DGNE DE COHORTES (DQC) elimina muchos de los sesgos usualmente presentes en 
las comparaciones intrasujetos (Shadish et al., 2002). Es especialmente recomendable con insti- 
tuciones educativas y sociales que precisan utilizar grupos naturales de individuos con caracterís- 
ticas muy similares que experimentan un programa, tratamiento o intervención, tomando como 
comparación grupos naturales anteriores (o en ciertas circunstancias, posteriores) que no lo ex- 
perimentaron. Pero conviene tener presente que si la utilización de grupos naturales implica una 
manipulación, el diseño será considerado cuasiexperimental; en caso contrario, será considerado 
comparativo. Su estructura se expone en el cuadro 11.4. 


CUADRO 11.4 
DGNE de cohortes 


Grupo Asignación | Pretest Postest 


Primera cohorte (GC) NA - 
Segunda cohorte (GE) NA Y2 
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Este diseño fue utilizado por Minton (1975) para probar si la primera serie del programa de TV 
Barrio Sésamo afectaba a las puntuaciones en el Metropolitan Readiness Test. Una muestra de 977 
niños de jardín de infancia que siguió el programa y a la que se administró el test al final del 
curso, sirvió como grupo experimental (o segunda cohorte). Como grupo de control (o primera 
cohorte) se emplearon las puntuaciones obtenidas en el Metropolitan por 524 hermanos mayores 
de los niños del grupo experimental cuando tenían su misma edad y asistían al mismo curso que 
ellos, pero no habían visto el programa. En este caso, la propia definición de las cohortes y la 
utilización de cohortes de hermanos permite conceptualizar como manipulado el seguimiento 
o no del programa Barrio Sésamo. Mediante ANOVA no se encontraron diferencias significativas 
entre grupos en ninguno de los subtest del Metropolitan, con excepción del subtest de Alfabeto. 


— ElDISEÑO DGNE CON MÁS DE DOS GRUPOS es una de las variedades más usuales de ampliación del 
DGNE original. Puede tratarse de más de un grupo de control, o más de un grupo de tratamiento, 
o de ambos, cada uno de ellos con sus propias ventajas metodológicas. Para el caso de un GE y 
dos GC su estructura se presenta en el cuadro 11.5. 


CUADRO 11.5 
DGNE con más de dos grupos 


Grupo Asignación | Pretest Postest 


Grupo experimental (GE) NA Ye] Ye 


Grupo de control (GC1) NA Yc11 Yci2 
Grupo de control (GC2) NA Yco1 Ycoo2 


Cuevas, González, Núñez y Rodríguez (2002) utilizaron este diseño para evaluar un programa de 
mejora de la comprensión oral, que definieron como la capacidad para entender y extraer signifi- 
cado de todos aquellos estímulos presentados auditivamente. Para ello se sirvieron de un subtest 
del Test de Illinois de habilidades lingúísticas (ITPA). La muestra constó de 139 alumnos de los dos 
primeros cursos de Educación Primaria, de los que 38 alumnos se asignaron al GE y los restantes 
101 se asignaron a tres grupos de control, uno de los cuales no recibió pretest con el objeto de 
controlar el efecto de sensibilización al pretest. No se encontraron diferencias en el pretest, pero 
en el postest el GE apuntó diferencias significativas en diversas comparaciones con los grupos 
de control y en su conjunto. Los resultados permitieron a los autores concluir la eficacia del pro- 
grama de intervención para mejorar la capacidad de comprensión, y argumentar sobre su validez 
en la prevención de déficits que puedan producir dificultades en la adquisición de aprendizajes 
escolares. 


Labrador, Fernández-Velasco y Rincón (2006) se propusieron determinar la eficacia de un pro- 
grama de tratamiento breve del trastorno por estrés postraumático (T EP) en mujeres víctimas de 
violencia doméstica. La muestra estuvo constituida por 20 participantes que cumplían los crite- 
rios DSM-IV-TR para el diagnóstico de TEP, 10 para el grupo de control de lista de espera y 10 
para el grupo de tratamiento, que a su vez fue dividido en dos grupos de 5 mujeres cada uno que 
diferían por seguir un orden diferente de aplicación de las terapias. El programa de tratamiento se 
aplicó de forma individual a lo largo de 8 sesiones (2 meses), siendo sus componentes fundamen- 
tales la psicoeducación, técnicas de desactivación y las dos terapias (cognitiva y de exposición). Se 
utilizó un diseño cuasiexperimental con dos grupos independientes con medidas repetidas (pre- 
tratamiento y postratamiento). Los autores analizaron el efecto conjunto de grupo y tiempo con 
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ANOVA 2x [2]. Los resultados en el postratamiento indicaron que el programa fue efectivo para la 
reducción del TEP en el 100% de los casos. Se produjo también una mejora significativa en otros 
síntomas colaterales que suelen presentar este tipo de víctimas, tales como depresión, autoesti- 
ma, inadaptación y cogniciones postraumáticas, pero no se hallaron diferencias significativas en 
función de que se alterara el orden de aplicación de la terapia cognitiva y la terapia de exposición. 


Otra variación del DGNE se presenta cuando falta alguno de los ingredientes del diseño básico, 
o bien porque carece de pretest, o bien porque carece de grupo de control. Puesto que no tienen los 
requisitos esenciales de los diseños cuasiexperimentales se han denominado DISEÑOS PREEXPERIMEN- 
TALES (Cook y Campbell, 1979). Dos de los diseños preexperimentales más frecuentemente usados son 
el DISEÑO DE UN GRUPO CON PRETEST Y POSTEST, que carece de grupo control, y el DISEÑO CON GRUPO 
CONTROL SOLAMENTE POSTEST, que carece de pretest, que se ilustran a continuación. 


— Núñez, Solano, González-Pienda y Rosário (2006) proporcionan un ejemplo del diseño de un gru- 
po con pretest y postest. Su investigación trató de averiguar en qué medida el mayor o menor 
grado de conciencia del alumno sobre el proceso de autorregulación del aprendizaje y estudio tie- 
ne efectos significativos sobre la calidad de las respuestas dadas en instrumentos de evaluación 
tipo autoinforme. Se empleó un grupo de 90 estudiantes universitarios (63 mujeres y 25 varones) 
de diferentes cursos que fueron evaluados antes y después de ser sometidos a una intervención de 
8 sesiones de trabajo sobre estrategias y tareas implicadas en el proceso de autorregulación. Los 
resultados mostraron diferencias en 3 de las 5 dimensiones de autorregulación. Los autores anali- 
zaron también los resultados en función del sexo, encontrando algunas diferencias entre varones 
y mujeres. 


— Como ejemplo del diseño con grupo control solamente postest puede consultarse un trabajo de 
Soriano, Chebaani, Soriano y Descals (2011), quienes utilizaron 59 alumnos de tres aulas de un 
centro privado, dos de las cuales fueron grupos experimentales que recibieron una condición de 
tratamiento (enseñanza recíproca o bien enseñanza recíproca + autoobservación) y la tercera sir- 
vió como grupo de control. Se registraron dos tipos de medidas (de efectos específicos y de ge- 
neralización) en todos los participantes. Puesto que no se emplearon pretests, los investigadores 
comprobaron la no equivalencia entre grupos mediante ANOVA en edad, inteligencia y compren- 
sión de textos. Los resultados apuntaron mejoras en las medidas de efectos específicos y algunas 
medidas de generalización en los grupos experimentales respecto del grupo de control, pero no 
se encontraron diferencias significativas entre los dos grupos experimentales. 


11.2.4. Alternativas experimentales del diseño con grupo control no equivalente 


El rasgo esencial que distingue diseño experimental y diseño cuasiexperimental es el empleo de 
asignación aleatoria de los tratamientos a las unidades experimentales. Un rasgo distintivo secundario 
es que en los diseños cuasiexperimentales el tratamiento suele ser un programa de intervención de mo- 
derada o larga duración, mientras que en los diseños experimentales el tratamiento suele tener corta o 
muy corta duración. En este sentido el diseño DCNE podría convertirse en un auténtico diseño expe- 
rimental si la asignación de grupos a unidades experimentales fuera aleatoria, como se presenta en la 
primera parte del cuadro 11.6. También sería experimental el diseño con grupo control más simple que 
emplea solamente la medida postest, como se muestra en la segunda parte del cuadro 11.6. La única 
diferencia con el diseño experimental es la duración del tratamiento. 
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CUADRO 11.6 
Versiones experimentales del DGNE 


Asignación | Pretest Postest 


A Y Y) 


A 
A 
A 


En esencia, y trascendiendo la duración del tratamiento, el diseño de la primera parte del cuadro 
11.6 sería un DCA con pretest. Repárese que en este diseño el pretest podría ser innecesario, salvo que 
por algún motivo particular el investigador esté interesado en comprobar que se cumple la equivalencia 
inicial de los grupos (p. ej., disponer de pocas unidades experimentales). De manera similar, el diseño 
de la segunda parte del cuadro 11.6 sería un DCA estándar. En ambos casos la asignación aleatoria de 
unidades aseguraría que los dos grupos fuesen equivalentes en el postest antes de iniciar el tratamiento. 

Ejemplos de aplicación de este diseño con estructura cuasiexperimental pero naturaleza experimen- 
tal pueden consultarse en Aguilar, Galvis, Heredia y Restrepo (2008) sobre los efectos de la cafeína y la 
taurina en la atención y en Gómez-Peresmitres ef al. (2013) sobre la efectividad de dos programas de 
intervención para la prevención de trastornos de la alimentación. 

El diseño también admite variaciones similares a las que tratamos en la sección anterior. Por ejem- 
plo, en un trabajo de Anuel et al. (2012) se evaluó el efecto producido por dos programas (positivo y 
cognitivo) empleando un diseño experimental con estructura cuasiexperimental sobre la mejora de la 
imagen corporal en dos fases (pre y postexperimental) y cuatro grupos de 30 niños cada uno, un grupo 
de control y tres grupos experimentales (programa positivo, cognitivo y combinado). El análisis uti- 
lizó ANOVA y ANCOVA. Los autores se esforzaron además en controlar numerosas variables extrañas 
(edad y sexo, ingresadas como covariantes, nivel socioeconómico, por constancia, e instrumentación, 
empleando un instrumento con alta fiabilidad) y en reducir la varianza de error (usando un triple pro- 
ceso de aleatorización en la composición de los grupos). Un caso similar de diseño experimental con 
apariencia de DGNE que utilizó dos grupos de tratamiento y un grupo de control, puede consultarse 
en Fernández-Calvo et al. (2011). 


A. El diseño de cuatro grupos de Solomon 


La fusión de las dos versiones experimentales del cuadro 11.6 constituye un nuevo diseño experi- 
mental con estructura de DGNE que fue originalmente propuesto por Solomon (1949) (y por ello cono- 
cido como DISEÑO DE CUATRO GRUPOS DE SOLOMON), cuya estructura se presenta en el cuadro 11.7. El 
análisis estadístico del diseño de cuatro grupos de Solomon tiene muchos matices y permite considerar 
varias opciones analíticas de interés. 

Un primer aspecto consiste en probar el efecto de sensibilización al pretesto efecto de la administra- 
ción de pruebas, para lo cual se disponen las medidas Y2, Y 4, Y5 e Y 6 en una tabla de doble entrada co- 
mo un diseño de dos factores, A (pretest versus no pretest) y B (tratamiento versus no tratamiento). Si el 
pretest actuara como sensibilizador entonces cabría esperar que el efecto del tratamiento será diferente 
si se utiliza pretest que el efecto esperado si no se utiliza. La presencia de una interacción significativa 
implicaría que el efecto de tratamiento depende de la presencia o no de medidas pretest. El análisis de 
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efectos simples con las comparaciones Y2-— Y 5 (medidas con tratamiento) y las comparaciones Y4- Y6 
(medidas sin tratamiento) permitirá precisar la naturaleza de la interacción. 


CUADRO 11.7 
Estructura del diseño de cuatro grupos de Solomon 
Asignación | Pretest | Programa | Postest 
Y, 
Ya 


Y; 
Y6 


Un segundo aspecto concierne a la prueba de los efectos de tratamiento, que únicamente pueden 
considerarse si se han descartado efectos de sensibilización. Todas las opciones analíticas contempladas 
en el diseño con grupo control no equivalente son también válidas aquí. Pero una complicación añadida 
es que no existe una única prueba del efecto de tratamiento, sino muchas. Las comparaciones Y2- Y1, 
Y5-Y3, Y2-Y4|Y1, Y3 (ANCOVA) e Y5— Y 6 (ANOVA) se consideran replicaciones alternativas del efec- 
to de tratamiento, cualquiera de las cuales sería válida como prueba, pero el interés fundamental reside 
en la consistencia de los resultados de tales comparaciones. Si todas producen el mismo resultado, la 
garantía de alta validez interna y externa será incuestionable. 

Ejemplos de aplicación del diseño de cuatro grupos de Solomon en Psicología pueden consultarse 
en Kvalem et al. (1996) y Probst (2003). Algunos aspectos metodológicos se consideran en Braver y Braver 
(1988), Huck y Sandler (1973), Pascual, Estarelles y Camarasa (1993) y García, Frías y Pascual (1999). 


B. El diseño de replicaciones cambiantes 


Un diseño que se presenta unas veces como cuasiexperimental y otras como experimental es el DI- 
SEÑO DE REPLICACIONES CAMBIANTES (switching replications design, DRC), donde el tratamiento es re- 
plicado, pero en la repetición los dos grupos intercambian sus roles, y el grupo que recibe tratamiento en 
una primera fase no lo recibe en la segunda (véase cuadro 11.8). Este diseño es especialmente idóneo en 
contextos de investigación social o educativa. Por ejemplo, para evaluar un programa de matemáticas, 
todos los estudiantes reciben un pretest al comienzo del año escolar, pero un grupo recibe el programa 
en el primer semestre y el otro lo recibe en el segundo. 


CUADRO 11.8 
Estructura del diseño de replicaciones cambiantes 


Asignación | Pretest | Tratamiento | Postestl | Tratamiento | Postest2 


NA Y; T Y) Y3 
NA Ya - Ys Y6 


Dos de los posibles resultados que este diseño puede presentar se muestran en la figura 11.6. El grá- 
fico de la izquierda presenta un patrón divergente en el primer postest y convergente en el segundo, lo 
que apunta que el efecto del tratamiento es inmediato en la primera medida postest, pero no manifies- 
ta ninguna mejora en la segunda medida postest. Por el contrario, la figura de la derecha presenta un 
patrón divergente en el primer postest y casi paralelo en el segundo, lo que apunta que el tratamiento 
tiene un efecto de mejora a largo plazo que se observa en medidas sucesivas. 
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Pretest  Postestl  Postest2 Pretest  Postestl  Postest2 


Figura 11.6. — Efecto de tratamiento persistente a corto plazo (izquierda) y a largo plazo (derecha) 


Basadur, Graen y Scandura (1986) aplicaron el diseño DRC para analizar los efectos del entrena- 
miento sobre las actitudes hacia el pensamiento divergente en dos grupos de ingenieros. Al grupo ex- 
perimental (n = 65) se le asignó de forma arbitraria (no aleatoria) el tratamiento (un programa creativo 
de solución de problemas) y al grupo de control (n = 47) la condición de control sin programa. A los dos 
grupos se les administraron todas las medidas dependientes. Después de 6 semanas se volvieron a ad- 
ministrar las mismas medidas a los dos grupos y el grupo de control pasó a recibir el programa creativo 
y el grupo experimental la condición de control. Después de 6 semanas se administró de nuevo a los dos 
grupos todas las medidas dependientes. Los autores analizaron los datos mediante un modelo ANCOVA 
con corrección de la fiabilidad. 


11.3. DISEÑO DE DISCONTINUIDAD DE LA REGRESIÓN 


11.3.1. Introducción 


Cuando la regla de asignación no es aleatoria, pero sí al menos conocida, las posibilidades interpre- 
tativas mejoran considerablemente, y se aproximan a las de un diseño experimental auténtico siempre 
que se aplique un análisis estadístico apropiado (Rubin, 1977, Shadish, Galindo, Steiner y Cook, 2011). 
El diseño prototípico que utiliza una regla de asignación no aleatoria pero conocida (NAC) es el DISEÑO 
DE DISCONTINUIDAD DE LA REGRESIÓN (DDR), originalmente propuesto por Thistlewaite y Campbell 
(1969). Es un diseño que goza de mucho prestigio, y aunque todavía se emplea poco en la práctica en 
Psicología y en Ciencias de la Salud (Shadish y Cook, 2009; Shadish et al., 2002), ha pasado a ser muy 
popular en otras Ciencias Sociales como la Economía (véase Imbens y Lemieux, 2008) y su perspectiva 
de uso podría cambiar también en Psicología, como apunta Cook (2008, p. 636). El uso de la regla de 
asignación NAC conforma la base donde radica el prestigio del que goza el DDR, ya que permite cono- 
cer sin ambigiiedad la probabilidad que tiene cada participante de formar parte del GE o del GC, antes 
de que ocurra la administración del programa. 
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El diagrama del diseño se presenta en el cuadro 11.9. Es de destacar la notable similitud del diseño 
de discontinuidad de la regresión con el diseño con grupo control no equivalente básico (cuadro 11.1), 
del que únicamente se diferencia por el uso de la regla de asignación no aleatoria pero sí conocida. 


CUADRO 11.9 
Diseño de discontinuidad de la regresión 


Asignación | Pretest | Programa | Postest 


NAC 


Para ilustrar el análisis del diseño DDR, utilizamos el ejemplo 11.2 con datos ficticios inspirados en 
una investigación real. En el contexto del curso escolar 1992-1993, un grupo de 100 niños de un centro 
escolar de Madrid fue clasificado según su puntuación en una escala básica generada a partir de los 
resultados del rendimiento en matemáticas durante el curso anterior. La institución pudo determinar 
un punto de corte por encima del cual los niños podrían mejorar notablemente con ayuda de un pro- 
grama específico de matemática avanzada (con el objeto de prepararles para participar en unas prue- 
bas de rendimiento para un concurso entre colegios emitido en la televisión pública) y por debajo del 
cual la mejora se suponía prácticamente insignificante, no mereciendo la pena el esfuerzo económico 
que representaría la administración del programa de matemática avanzadas en tales casos. Sobre esta 
premisa, los sujetos que obtuvieron puntuaciones por encima de un determinado punto de la escala 
(denominado en este contexto PUNTO DE CORTE, que se fijó en 20 puntos o más), constituyeron el GE, 
recibieron el programa de mátemática avanzada y fueron sometidos a un intenso entrenamiento con el 
programa durante un mes, mientras que los sujetos que obtuvieron puntuaciones por debajo del punto 
de corte formaron el GC, siguieron con su programa de matemáticas habitual y no recibieron ningún 
otro tratamiento. Las puntuaciones obtenidas en el postest reflejan el rendimiento de los alumnos de 
ambos grupos al final del programa de entrenamiento. 

Los datos empíricos del ejemplo 11.2 se muestran en el cuadro 11.10 de forma abreviada por pro- 
blemas de espacio, empleando pret y post para hacer referencia a pretest y postest, respectivamente. 
También para facilitar el desarrollo del análisis estadístico, la pertenencia a grupos se ha codificado con 
los valores *0” para el grupo de control y '1' para el grupo experimental. 

Dos posibles resultados de interés pueden presentarse utilizando el diseño de discontinuidad de la 
regresión (véase figura 11.7). Si representamos el postest en función del pretest, independientemente 
para cada grupo, y especificamos un punto de corte que determina el grupo de sujetos a quienes se 
administrará el programa y el grupo a los que no se les administrará (en la figura 11.7 el punto de corte 
se fijó en 25 puntos), un efecto nulo de tratamiento implicaría una línea de regresión continua entre 
ambos grupos (figura 11.7, izquierda), mientras que el efecto no nulo de tratamiento implicaría una 
línea de regresión discontinua y por consiguiente una separación de los grupos en el punto de corte 
(figura 11.7, derecha). Puesto que los grupos GE y GC se han tratado de forma diferente, lo que se espera 
en caso de efecto nulo es que la recta de regresión discurra de forma continua con las puntuaciones 
de los dos grupos. Por el contrario, lo que se espera en el caso de efecto no nulo es que la recta de 
regresión se rompa en el punto de corte, produciendo en realidad dos rectas de regresión, que se asumen 
aproximadamente paralelas, una para cada grupo, mostrando así un efecto diferencial a favor del grupo 
al que se administró el programa respecto del grupo al que no se le administró. El efecto diferencial 
entre las dos rectas de regresión es precisamente el efecto que se atribuye al tratamiento. 
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CUADRO 11.10 
Datos empíricos del ejemplo 11.2 
pret | post | grupo pret | post | grupo pret | post | grupo pret | post | grupo 
4 9 0 10 14 0 18 19 0 22 25 1 
6 11 0 11 16 0 19 21 0 25 31 1 
3 10 0 13 15 0 16 22 0 26 32 1 
5 10 0 12 15 0 19 20 0 21 24 1 
3 11 0 12 14 0 12 23 0 27 31 1 
5 9 0 11 12 0 13 21 0 21 34 1 
6 12 0 11 10 0 18 23 0 20 23 1 
6 9 0 10 13 0 13 22 0 20 33 1 
5 8 0 12 17 0 15 22 0 20 27 1 
4 8 0 13 16 0 17 21 0 22 32 1 
5 9 0 11 16 0 20 21 1 20 32 1 
5 10 0 13 18 0 20 26 1 20 23 1 
7 11 0 15 15 0 21 28 1 21 29 1 
6 8 0 12 18 0 22 29 1 23 26 1 
7 12 0 12 18 0 20 27 1 21 25 1 
8 10 0 13 16 0 20 25 1 21 30 1 
8 11 0 15 16 0 21 24 1 20 25 1 
7 10 0 15 15 0 22 32 1 20 25 1 
6 9 0 14 17 0 20 23 1 22 26 1 
7 12 0 16 16 0 20 25 1 23 31 1 
8 11 0 14 17 0 20 24 1 26 31 1 
6 9 0 13 18 0 20 29 1 20 28 1 
8 11 0 16 20 0 22 25 1 24 30 1 
9 13 0 17 21 0 23 26 1 23 34 1 
10 14 0 17 19 0 23 28 1 22 33 1 


post 
postest 


0 10 20 30 40 


pretest pretest 


Figura 11.7. — Efecto de tratamiento nulo (izquierda) y efecto de tratamiento no nulo (derecha) en el DDR. 
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11.3.2. Análisis estadístico 


La estrategia más frecuente para analizar los datos de un diseño DDR es el ANCOVA, tomando el 
pretest como covariante y como factor la administración (pertenencia al GE) o no administración (per- 
tenencia al GC) del tratamiento o programa de intervención. Y como siempre que se utiliza el análisis 
de covarianza, el supuesto de homogeneidad de las pendientes de regresión es una condición que debe 
cumplirse para poder interpretar apropiadamente el submodelo ANCOVA. Sin embargo, la interpreta- 
ción correcta de los resultados debe practicarse realizando algunos cambios sobre la estrategia en dos 
etapas de Milliken y Johnson que tratamos en el capítulo 5. 


— En primer lugar, es necesario definir el punto de corte. En el ejemplo 11.2 se estableció que los 
niños que obtuvieran puntuaciones iguales o superiores a 20 puntos constituyeran el grupo expe- 
rimental y los que obtuvieran 19 puntos o menos engrosarían el grupo de control. 


— En segundo lugar, es recomendable centrar la covariante (o sea, calcular la diferencia de cada 
puntuación respecto del punto de corte). 


— En tercer lugar, se requiere emplear codificación tipo regresión, o sea, valores 0-1” para codificar 
la pertenencia a grupos ('0” para el Grupo control y '1” para el Grupo experimental). Una vez rea- 
lizados los cambios, se utiliza ANCOVA tomando el postest como variable dependiente, el pretest 
centrado (una nueva variable que llamaremos pretcent) como covariante y grupo como factor. 


Para ilustrar el proceso, utilizamos los datos del ejemplo 11.2, donde un total de 60 niños formaron 
el grupo de control (GC= 0, con puntuaciones menores de 20 puntos) y los restantes 40 niños consti- 
tuyeron el grupo experimental (GE=1, con puntuaciones iguales o mayores de 20 puntos). El análisis 
descriptivo se muestra en la salida 11.6. Aunque no se muestran los resultados, en la primera fase de la 
estrategia en dos etapas de Milliken y Johnson se concluyó que las pendientes de regresión no son nu- 
las: F(2,96) = 75.254; P < .001 y en la segunda fase la conclusión fue que las pendientes de regresión son 
paralelas u homogéneas: F(1, 96) = 0.001; P = .980. Por su parte, la figura 11.8 muestra las pendientes de 
regresión de ambos grupos, denotando la presencia de una moderada divergencia. 


SALIDA 11.6 
Análisis descriptivo de los datos del ejemplo 11.2 
Medida Pretest Medida Postest 
Suma Varianza Suma Varianza 
642.000 20.044 873.000 20.319 


864.000 3.579 1112.000 12.421 
1506.000 42.158 1985.000 59.563 


El resultado fundamental se resume en la salidas 11.7 (para la estimación de parámetros) y 11.8 (para 
la descomposición de la varianza) y permite una interpretación sustantiva de los resultados. 


SALIDA 11.7 
Estimación de parámetros del submodelo ANCOVA con pendientes paralelas 
Variable dependiente: rend 
Límites IC 95% 
Parámetro Inferior | Superior 
Constante A 25.543 27.236 
grupo=GE . 1.769 5.511 
pretcent a 0.740 1.024 


OEdiciones Pirámide 


424 Diseños de investigación en Psicología 


SALIDA 11.8 
Ajuste del submodelo ANCOVA con pendientes paralelas 


Variable dependiente: rend 
Fuente | SC tipo III MC E 
Modelo 5241.224 2 | 2620.612 | 387.779 
grupo 100.748 100.748 14.908 


pretcent 1027.724 1027.724 | 152.075 
Residual 655.526 6.758 
Total 5896.750 


30- 


grupo 
..o 
A 1 


postest 


cpretest 


Figura 11.8. — Efecto del programa de aprendizaje intensivo en matemáticas. 


En primer lugar, una vez comprobado que las pendientes no son nulas pero sí paralelas, la salida 
11.8 es un ANCOVA con las puntuaciones en el postest como variable de respuesta tomando el pretest 
centrado pretcentcomo covariante y el grupo como factor. 

En segundo lugar, los parámetros del submodelo ANCOVA con pendientes paralelas (salida 11.7) 
estiman una pendiente común de $fz = 0.882, y una vez corregida la moderada desviación de la tenden- 
cia en ambos grupos, el valor de la intersección en el punto de corte para el grupo experimental es de 
Bo = 26.389 (que es el valor de la variable de respuesta para el GE cuando el pretest centrado tiene un 
valor de cero). Similarmente, el valor de la intersección en el punto de corte para el grupo de control es 
26.389 — 3.640 = 22.749 (que es el valor de la variable de respuesta para el GC cuando el pretest centrado 
tiene un valor de cero). 

El efecto diferencial del programa de aprendizaje matemático es la diferencia entre las dos líneas de 
regresión (que se asumen homogéneas) obtenidas en el punto de corte, y representa una diferencia de 
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3.640 puntos en la escala del postest (véase figura 11.8). Este es el rendimiento diferencial del GE res- 
pecto del GC que se ha obtenido como consecuencia de la aplicación del programa. Puesto que el efecto 
diferencial es estadísticamente significativo, F(1,97) = 14.908; P < .001, el programa de rendimiento ma- 
temático puede considerarse satisfactorio. 


11.3.3. Supuestos del DDR 


Conviene tener presente que el enfoque analítico al DDR es subsidiario del cumplimiento de varios 
supuestos (Ato, 1995b): 


— En primer lugar, la fijación de un punto de corte exacto. La asignación de sujetos al GC o al GE debe 
ser inambigua. La existencia de puntos de corte difusos, aunque no hacen inviable el análisis, de- 
bilitan su potencia (Shadish y Cook, 2009). En el ejemplo 11.2, puntuaciones iguales o superiores 
a 20 puntos definieron el nivel mínimo del grupo que siguió el programa (GE). Excelentes aplica- 
ciones de este diseño han aprovechado la existencia de puntos de corte naturales (p. ej., Carrell, 
Hoekstra y West, 2011). 


— En segundo lugar, la especificación de un modelo lineal. El análisis desarrollado anteriormente 
postula una relación lineal entre pretest y postest, pero otras formas funcionales son también 
posibles, aunque requieren modelos estadísticos más sofisticados (véase Lee y Card, 2008). 


— En tercer lugar, la existencia de un tamaño muestral suficiente. Se requiere un número mínimo 
de participantes por grupo para que las estimaciones de los parámetros tengan las propiedades 
estadísticas de insesgabilidad y varianza mínima. Con esta finalidad, se recomienda utilizar no 
menos de 30 sujetos por grupo. 


— En cuarto lugar, se requiere una distribución común en el pretest. Se supone que los dos grupos 
proceden de una misma distribución en el pretest y que el punto de corte divide la distribución 
original en dos grupos. 


— Y finalmente, que no existan amenazas contra la validez externa. Deben cuidarse hasta el extremo 
las condiciones de implementación del programa, distinguiendo con claridad entre lo que se ad- 
ministra al GÉ (que define el programa de tratamiento) y lo que se administra al GC (que es ajeno 
al programa). La generalización de los resultados depende directamente de la escrupulosidad con 
que se respeten tales condiciones. 


11.3.4. Algunos ejemplos publicados con el DDR 


Carrell ef al. (2011) examinaron el efecto del consumo de alcohol sobre el rendimiento en alumnos 
de la Air Force Academy de los Estados Unidos (USAFA). Aprovechando la existencia de una prohibición 
legal de consumir alcohol antes de los 21 años en los campus de USAFA (la violación puede conducir 
a la expulsión de la Academia), y la aplicación de pruebas de rendimiento estandarizadas a todos los 
alumnos, los autores utilizaron un diseño DDR sobre una muestra de 3884 estudiantes matriculados 
durante el periodo 2000 y 2006, y encontraron que el alcohol provoca una reducción significativa del 
rendimiento de casi 0.10 desviaciones típicas. Los autores detectaron además que los efectos negativos 
del alcohol se dejaban notar en mayor medida en alumnos con alto o muy alto rendimiento que en 
alumnos con rendimiento bajo o muy bajo. 
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La alta consideración del DDR como un diseño riguroso se ha manifestado en numerosas investi- 
gaciones. En su tesis doctoral, Ashworth (2012; véase también Ashworth y Pullen, 2014) se propuso dos 
objetivos: 1) determinar la efectividad de una intervención por niveles en vocabulario para estudiantes 
con riesgo de sufrir dificultades de lectura y lengua y 2) comparar los resultados de un DDR con los de 
un diseño experimental auténtico con el objeto de demostrar la viabilidad del DDR para esta temáti- 
ca. Se utilizaron datos de archivos administrativos de un estudio previo que adaptaron como DDR y 
se desarrolló un nuevo estudio aleatorizado para responder a los dos objetivos del trabajo. Los resulta- 
dos del análisis para el primer objetivo proporcionaron evidencia de que la instrucción en niveles de 
vocabulario es beneficiosa para estudiantes jóvenes en riesgo de dificultad para los niveles receptivo y 
expresivo. Para responder a la segunda cuestión compararon los resultados de la aplicación de un dise- 
ño DDR con los de un diseño experimental sobre una intervención graduada de vocabulario para niños 
en riesgo de sufrir dificultades de lectura. Para el segundo objetivo, al comparar los resultados del estu- 
dio con el estudio previo se demostró que los resultados eran comparables en todos los niveles, aunque 
ligeramente superiores para el estudio aleatorizado. 

En un trabajo recientemente publicado, Zhang, Wang, Ding y Liu (2014) se interesaron por investigar 
las dificultades específicas en geometría, un componente esencial del aprendizaje de las matemáticas, 
que muchos estudiantes encuentran. El estudio examinó el efecto de una acomodación en la represen- 
tación integrada de objetos (7OR) sobre el rendimiento de estudiantes con dificultades en geometría 
(GD) en comparación con el de estudiantes sin GD. Se utilizaron 118 alumnos de Primaria que reali- 
zaron una prueba de solución de problemas geométricos bajo una condición de test estándar y bajo 
la condición de acomodación IOR. Los 36 alumnos con puntuaciones en GD por debajo del 40% en la 
prueba de solución de problemas geométricos formaron parte del grupo experimental, mientras que 
los 82 restantes con puntuaciones por encima del 40% en la misma prueba constituyeron el grupo de 
control. Todos los estudiantes fueron evaluados en la condición de test estándar y en la condición de 
acomodación TOR. Los resultados fueron analizados con ANOVA y ANCOVA y sugirieron que los alum- 
nos del GE se beneficiaron más que los alumnos del GC bajo la condición de acomodación IOR. 


11.4. DISEÑOS DE SERIES TEMPORALES INTERRUMPIDAS 


11.4.1. Introducción 


Una SERIE TEMPORAL es el registro de un conjunto de observaciones a lo largo del tiempo sobre 
una variable de respuesta que, en el caso más simple, tiene dos fases: una FASE PREINTERVENCIÓN y 
una FASE POSTINTERVENCIÓN, entre las cuales se introduce un tratamiento o programa cuyo impacto se 
desea evaluar. El objeto que se persigue con este tipo de datos es el desarrollo de modelos que permitan 
explicar los patrones de cambio a lo largo del tiempo. Hay muchas situaciones en psicología social, 
educativa y clínica donde el análisis de tales patrones de cambio representan áreas de investigación 
totalmente consolidadas. 

El DISEÑO DE SERIES TEMPORALES INTERRUMPIDAS (DST 1) fue originalmente propuesto por Camp- 
bell (1963) con el objeto de evaluar el impacto de algún programa o intervención social (p. ej., programas 
educativos, prevención de accidentes laborales, mejora de la información sanitaria, reducción del há- 
bito de fumar y un amplio etcétera). Normalmente se utiliza un grupo numeroso de individuos, pero 
algunos de los procedimientos analíticos también pueden aplicarse al caso de un único individuo, so- 
bre todo en situaciones clínicas, en el marco de los DISEÑOS DE CASO ÚNICO (DCU), que trataremos en 
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el capítulo 12. Son abundantes las aplicaciones de este diseño en las Ciencias de la Salud (p. ej., Ramsay 
et al., 2003; Penfold y Zhang, 2013). 

Hay muchas variedades del diseño con series temporales interrumpidas (véase Vallejo, 1995a), pero 
dos de ellas son de especial interés para la investigación psicológica: el DISEÑO DE SERIES TEMPORALES 
INTERRUMPIDAS SIMPLE, el más básico, que se caracteriza por la existencia de un único grupo, y el DISE- 
ÑO DE SERIES TEMPORALES INTERRUMPIDAS CON GC NO EQUIVALENTE, que distingue dos grupos, un GE 
y un GC. 

La dificultad principal reside en el análisis de los datos (Arnau, 2001; McCleary y McDowall, 2004; 
Vallejo, 1995b, 1995c, 1996), principalmente porque al tratarse de un diseño longitudinal se plantean 
los problemas de independencia y autocorrelación que ya tratamos en los dos capítulos anteriores. La 
técnica de análisis más fiable, pero que no siempre resulta fácil de implementar, es el análisis de series 
temporales, una técnica compleja que además requiere la presencia de un número elevado de puntos 
de observación por individuo. En aplicaciones de investigación de la psicología y disciplinas afines no 
es común el registro de muchos puntos de observación por participante. Por ello se ha hecho necesa- 
rio distinguir entre series temporales largas y series temporales cortas. Para analizar series temporales 
cortas se han propuesto numerosas técnicas de análisis que tienen que lidiar con el problema de la 
autocorrelación (Arnau, 1999; Blanca, 1999, 2001; Blanca y Ato, 1999; Huitema, 2011), lo que en ocasio- 
nes invalida la aplicación directa de los procedimientos derivados del modelo lineal clásico. El proce- 
dimiento más aceptado (Escudero y Vallejo, 2000; Huitema, 2011) es un proceso etápico consistente en 
transformar primero las puntuaciones originales para eliminar la autocorrelación que potencialmente 
puedan presentar los datos y utilizar después análisis de regresión con las puntuaciones transforma- 
das. Afortunadamente, este procedimiento de análisis bietápico puede realizarse en una sola etapa con 
el enfoque mixto o también con el análisis de regresión segmentada, que no trataremos aquí (véase en 
Wagner, Soumerai, Zhang y Ross-Degnan, 2002, una introducción asequible). Un reciente ejemplo de 
uso de este procedimiento puede consultarse en Taljaard, McKenzie, Ramsay y Grimshaw (2014). 


11.4.2. Diseño de series temporales interrumpidas simple 


La estructura del DSTTI simple es una generalización del diseño de un grupo pretest-postest que 
tratamos en la sección 11.2.3, ya que contiene múltiples medidas pretest y múltiples medidas postest, 
entre las cuales se inserta un tratamiento o programa de intervención (véase cuadro 11.11). 


CUADRO 11.11 
Diseño de series temporales interrumpidas simple 


Son necesarias algunas puntualizaciones respecto al diseño de un grupo pretest-postest, a saber: 


— En primer lugar, a diferencia de los diseños anteriores, la unidad experimental que se asigna a 
las condiciones de tratamiento es un punto en el tiempo, no una persona o un grupo de perso- 
nas. Los diferentes puntos temporales se asignan a uno de dos niveles de una variable explicativa: 
tratamiento o no tratamiento (control). Usualmente, el nivel de tratamiento es la FASE POSTINTER- 
VENCIÓN y el nivel de control es la FASE PREINTERVENCIÓN. Pero la regla de asignación de puntos 
de observación a las fases de control y tratamiento podría ser aleatoria (como sucede, por ejem- 
plo, en algunos DCU), no aleatoria pero sí conocida o no aleatoria ni conocida, que es el caso más 
común. 
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— En segundo lugar, se recomienda que el número de medidas pretest (y postest) no sea menor de 
10. Se denominan SERIES TEMPORALES CORTAS cuando se dispone de unas pocas medidas (menos 
de 20), pero en contextos socio-económicos es más común encontrar SERIES TEMPORALES LARGAS, 
donde hay un gran número de medidas pretest y postest, al menos 50 en cada fase. En este sentido, 
el DSTI simple suele emplear series temporales cortas. 


— Además, el análisis estadístico es diferente según el tipo de serie temporal. Las series tempora- 
les largas requieren ANÁLISIS DE SERIES DE TIEMPO, una técnica estadística que no es objeto de 
estudio en este texto (véase Vallejo, 1996). Por el contrario, las series temporales cortas pueden 
analizarse con los procedimientos del modelo lineal clásico (LM), siempre que se satisfagan los 
supuestos que tales procedimientos requieren, y en particular el supuesto de independencia de 
las observaciones. Es crucial evaluar primero la existencia de autocorrelación (mediante la prueba 
de Durbin-Watson) y la presencia de observaciones atípicas y corregirlas en caso necesario. 


Todo el interés analítico reside en observar la TENDENCIA (positiva, negativa o nula) que sigue la 
serie durante la fase preintervención y el NIVEL que alcanza en el punto donde la fase preintervención 
concluye. Del mismo modo, interesa también observar el nivel que se obtiene en el punto donde la fase 
postintervención comienza y la tendencia que presentan los datos durante esta fase. La diferencia entre 
los dos niveles (pre y postintervención) permite determinar la existencia de un CAMBIO DE NIVEL entre 
las dos fases. La diferencia entre las dos tendencias (pre y posintervención) permite evaluar la existencia 
de un CAMBIO DE TENDENCIA entre las dos fases. La figura 11.9 ilustra algunas de varias combinaciones 
posibles de cambio de nivel y cambio de tendencia. 
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: 
: 
: 
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: 
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: 
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Tendencia nula sin Tendencia nula con Tendencia positiva sin 
cambio de nivel cambio de nivel cambio de nivel 


de 


Tendencia negativa con Cambio de tendencia Cambio de tendencia 
cambio de nivel sin cambio de nivel con cambio de nivel 


Figura 11.9. — Tendencia, nivel, cambio de tendencia y cambio de nivel. 
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Caso 1: interacción no significativa 


El ejemplo 11.3 es un ejemplo ilustrativo de DST I simple (Ato y Vallejo, 2007, p. 521). En una gran 
ciudad se estudió la tasa de robos por cada 100.000 habitantes durante 10 meses consecutivos, al tér- 
mino de los cuales se puso en marcha un programa de vigilancia policial durante dos meses, que se 
mantuvo después durante los 8 meses siguientes. El equipo de gobierno de la ciudad deseaba saber qué 
cambios ha producido la aplicación del programa sobre la tasa de robos. Los datos empíricos aparecen 
en el cuadro 11.12. 


CUADRO 11.12 


Tasa de robos mensual (ejemplo 11.3) 


mes | robos | programa | difmes | inter mes | robos | programa | difmes | inter 
1 3.3 0 -9 0 1 1 1 
2 4.3 0 -8 0 1 2 2 
3 3.5 0 -7 0 1 3 3 
d 4.4 0 -6 0 1 4 4 
5 3.6 0 -5 0 1 5 5 
6 3.9 0 -4 0 1 6 6 
7 5.3 0 -3 0 1 7 7 
8 3.5 0 -2 0 1 8 8 
9 4.3 0 -1 0 1 9 9 
10 3.9 0 0 0 1 10 10 


En el ejemplo 11.3 pueden distinguirse tres variables: la variable de respuesta (tasa de robos), una 
variable numérica (mes de observación) y una variable categórica binaria, el programa de intervención 
codificada con codificación tipo regresión (usualmente la fase preintervención se codifica con *0”, y la 
fase postintervención con '1”). Las tres variables se presentan en las tres primeras columnas del cuadro 
11.12. La serie temporal se considera corta, por lo que el análisis estadístico más conveniente es el aná- 
lisis de regresión múltiple. Para ello, previamente se precisa diferenciar la serie por el punto anterior a su 
interrupción (que consiste simplemente en calcular la diferencia: difmes= mes—10), tal y como se mues- 
tra en la columna 4. Finalmente, se calcula la interacción entre el programa de intervención programa 
y la serie diferenciada difmes. El resultado se ha denominado inter y se obtiene calculando el producto 
programa x difmes, tal y como se muestra en la quinta columna. 


A continuación, se prueba un modelo de regresión lineal múltiple tomando como variable de res- 
puesta la tasa de robos y como predictores la serie diferenciada (difmes), la fase de intervención o trata- 
miento (variable categórica programa, que distingue la primera fase codificada con '0” y la segunda fase 
codificada con *1”) y la interacción (inter) entre los dos predictores. 


Es necesario tener en cuenta que el análisis de regresión resultante no será interpretable si los resi- 
duales del modelo estimado no son independientes. Para examinar la validez de este supuesto, lo más 
usual es obtener un diagrama de dispersión con los residuales tipificados del modelo estimado y de- 
terminar si presentan un patrón puramente aleatorio, es decir, un patrón que no muestre una forma 
estructurada. Si el patrón es aleatorio, se concluye que los residuales del modelo son independientes; 
en caso contrario, el análisis de regresión no es válido (véase figura 11.10). 
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Figura 11.10. — Diagrama de dispersión de los residuales tipificados. 


La figura 11.10 muestra un diagrama de dispersión con los residuales tipificados del modelo esti- 
mado, con líneas de referencia para la variable de respuesta en los valores 0 (punto medio), —2 (límite 
inferior) y +2 (límite superior). Observe que los residuales exhiben un patrón aleatorio, y que ninguno 
de ellos tiene valores absolutos mayores de 2. El patrón de independencia fue confirmado con el test de 
Durbin-Watson, que encontró una autocorrelación de 6 = —0.434, pero la prueba no resultó estadística- 
mente significativa: DW = 2.836; P =.213, sugiriendo así independencia de los residuales. 

El análisis de regresión con los datos del ejemplo 11.3 se presenta en la salida 11.9. Es muy impor- 
tante tener en cuenta algunos detalles para conseguir una interpretación correcta de los resultados de 
la salida 11.9 y de la figura 11.11b, que resume gráficamente el ajuste del modelo. 


SALIDA 11.9 
Estimadores de los parámetros del modelo de regresión 


Variable dependiente: comp 


Parámetro 


Error 


típico 


Límites IC 95% 


Inferior 


Superior 


Constante 
programa 
difmes 


programa x difmes 


0.388 
0.595 
0.073 
0.103 


3.407 
2.630 
0.103 
0.363 


5.052 
0.108 
0.205 
0.072 


— Puesto que la serie se ha diferenciado (o sea, toma valores negativos para la fase preinterven- 
ción y positivos para la fase postintervención), la constante o intersección es el punto para el que 
difmes=0, que marca precisamente el final de la fase preintervención: bo = 4.229 y representa la 
constante o intercepción del modelo. 
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robos 


Figura 11.11a. — Tasa de robos observada. 


robos 


difmes 


Figura 11.11b. — Tasa de robos estimada. 
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— El coeficiente difmes evalúa la tendencia que sigue la serie en la fase preintervención, que es 
b2 = 0.051 (o sea, un incremento en un mes produce un incremento de la tasa de robos de 0.05 
unidades durante la fase de preintervención). Esta tendencia es prácticamente nula y por tanto 
no es estadísticamente significativa: 1(16) = 0.700; P =.494. 


— El coeficiente para programa indica que hay un cambio de nivel de br = —1.369 puntos desde el 
final de la fase preintervención (4.229) al comienzo de la fase postintervención, que puede esti- 
marse que tendrá un valor de 4.229 + (- 1.369) = 2.860 (compruébese con la figura 11.11b). Pues- 
to que es negativo, se concluye que la introducción del programa pronostica una disminución 
en la tasa de robos de 1.369 puntos, una disminución que resultó estadísticamente significativa: 
t(16) = -2.301;P =.035. 


— Finalmente, la interacción programa x difmes evalúa el cambio de tendencia desde la fase prein- 
tervención a la fase postintervención, que en este caso produce un cambio negativo de magnitud 
B3 = 0.145. Puesto que se trata del cambio de tendencia, puede calcularse la tendencia de la fase 
postratamiento mediante la suma de la tendencia de la fase pretratamiento (el parámetro difmes) 
y el cambio de tendencia, o sea, 0.051 + (-0.145) = —0.094. O sea, la fase postratamiento presen- 
ta una tendencia moderadamente negativa, como se aprecia en la figura 11.11b. Sin embargo, el 
cambio de tendencia no fue significativo, £(16) = —1.415;P =.176) y por tanto cabe concluir que 
no hay diferencias significativas entre las tendencias de las fases pre y postintervención. 


El enfoque mixto es especialmente apropiado para analizar los datos del diseño de series tempora- 
les interrumpidas porque permite modelar los parámetros de covarianza, como se trató con los diseños 
de medidas repetidas. El análisis estadístico con el enfoque mixto asumiendo homogeneidad de varian- 
zas e independencia de las observaciones para el ejemplo 11.3 se presenta en la salida 11.10. Se utiliza 
con esta finalidad una matriz de covarianza de identidad escalada (1 E). Los resultados se corresponden 
exactamente con los de la salida 11.9, puesto que asumen también homogeneidad e independencia de 
las observaciones. 


SALIDA 11.10 
Análisis del ejemplo 11.3 con matriz IE mediante enfoque mixto 


Estructura de covarianza Loglik Desvianza (q) AIC BIC 

Identidad escalada (IE) 22.774 45.547 (5) 47.547 48.320 

Efectos aleatorios 

Parámetros Estimador E. típico Z de Wald P>|lz| 

Varianza IE 0.436 0.154 2.828 .005 
Efectos fijos 

Fuentes de variación 8lnum 8lden F P>F 
Constante 4.229 0.388 10.900 (16) .000 
programa —- 1.369 0.595 2.301 (16) .035 
difmes 0.051 0.073 0.700 (16) .494 
programa x difmes - 0.145 0.103 1.415 (16) .176 
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La interpretación sigue las mismas pautas que se apuntaron con el análisis de regresión de la salida 
11.9. La tasa de robos pronosticada para el principio de la fase postintervención es fy = 4.229 (como es- 
timamos anteriormente), el cambio de tendencia es negativo y de magnitud br = —- 1.369, la pendiente 
de la recta de regresión para la fase postintervención es 6 = 0.051 (como también estimamos ante- 
riormente) y el cambio de tendencia de la segunda fase respecto de la primera es fz = -0.145, pero el 
cambio de tendencia no fue estadísticamente significativo. 

Asumiendo por el contrario que se cumple homogeneidad de varianzas pero no independencia de 
las observaciones, el supuesto más común en diseños de series temporales interrumpidas (véase Hui- 
tema, 2011), conduce a una matriz de covarianza autorregresiva de primer orden (AR1). El correspon- 
diente análisis mediante el enfoque mixto se muestra en la salida 11.11. Los resultados no son iguales, 
pero resultan muy similares a los obtenidos con la matriz JE. 


SALIDA 11.11 
Análisis del ejemplo 11.3 con matriz AR(1) mediante enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Autoregresiva orden 1 (AR]) 22.095 44.190 (6) 48.190 49.735 
Efectos aleatorios 
Parámetros Estimador E. típico Z de Wald P>|lz| 
Varianza AR(1) 0.393 0.142 2.764 .006 
Rho (ARI) 0.313 0.241 -1.301 .193 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 
Constante 4.295 0.281 15.305 (16) .000 
programa 1.539 0.446 3.354 (16) .004 
difmes 0.058 0.053 1.078 (7.312) .297 
programa x difmes 0.137 0.074 -1.871 (6.831) .080 


Los criterios de información son más pequeños y la estrategia de ajuste condicional, que se resume 
en la salida 11.12, apunta que la diferencia no es significativa por lo que la interpretación debe reali- 
zarse con el modelo con matriz de covarianza de identidad escalada descartando el modelo con matriz 
autoregresiva de orden 1. Sin embargo, el ajuste del modelo con matriz de covarianza TE no es acepta- 
ble porque la interacción no es significativa. Cabe por tanto prescindir del componente de interacción 
y ajustar un modelo más simple, pero los efectos principales del modelo no suelen ser objeto de sim- 
plificación. La salida 11.13 resume el modelo simplificado, donde la tendencia de la serie temporal no 
es significativa, pero el programa de intervención sí: t(17) = 2.364; P = .030. Éste podría ser un ejemplo 
de aplicación de un programa de intervención no justificado por los datos empíricos, sino basado en 
criterios subjetivos. 


SALIDA 11.12 
Ajuste condicional de los modelos IE y AR(1) para el DSTI 


Modelo 1: DSTI simple con matriz IE 
Modelo 2: DSTI simple con matriz AR(1) 
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SALIDA 11.13 
Análisis del ejemplo 11.3 con matriz IE mediante enfoque mixto (modelo simplificado) 


Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Identidad escalada (IE) 22.405 44.809 (4) 46.809 47.642 
Efectos aleatorios 
Parámetros Estimador E. típico Zde Wald | P>]z| 
Varianza IE 0.461 0.158 2.915 .004 
Efectos fijos 
Fuentes de variación £8lnum 8lden F P>F 
Constante 2.460 0.362 6.803 (17) .000 
programa 1.442 0.610 2.364 (17) .030 
difmes 0.022 0.053 0.413 (17) .685 


Caso 2: interacción significativa 


El ejemplo 11.4 es otro ejemplo ilustrativo del DSTI simple (Ato y Vallejo, 2007, p. 527). Una institu- 
ción educativa está interesada en evaluar la efectividad de un programa de refuerzo (pref) para reducir 
las conductas distractoras (cdist) dentro del aula que durante una clase de apoyo presentan un grupo de 
niños de educación compensatoria. Para ello, con anterioridad a la administración de programa, cuya 
duración se estipuló por la dirección en 3 semanas escolares (o sea, un total de 15 días lectivos), el in- 
vestigador requirió al encargado del aula de apoyo que registrara durante los 20 días lectivos (dias) que 
duró la experiencia el número de conductas distractoras que presentaban los niños en su conjunto. Los 
datos empíricos se presentan en el cuadro 11.13. 


CUADRO 11.13 
Datos empíricos del ejemplo 11.4 


días | cdist | pref | difdia | interacción | '*. | días | cdist | pref | difdia | interacción 
1 42 0 -4 0 11 38 1 6 6 
2 58 0 =3 0 12 44 1 7 7 
3 58 0 -2 0 13 38 1 8 8 
4 67 0 -1 0 14 37 1 9 9 
5 73 0 0 0 15 41 1 10 10 
6 34 1 1 1 16 40 1 11 11 
7 42 1 2 2 17 41 1 12 12 
8 42 1 3 3 18 24 1 13 13 
9 33 1 4 4 19 29 1 14 14 
10 31 1 5 5 20 30 1 15 15 


Este ejemplo tiene también tres variables: la serie temporal días, a la que se refiere el registro de la va- 
riable de respuesta, el programa de refuerzo pref; codificado con codificación tipo regresión, asignando 
"” cuando se administra el programa (o sea, durante los 15 últimos días) y '0” cuando no se adminis- 
tra (o sea, durante los 5 primeros días), y el número de conductas distractoras cdist, que representa la 
variable de respuesta. Además, se requiere la definición de dos nuevas variables: (1) la serie temporal 
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precisa ser diferenciada, calculando la nueva variable difdia = dias—-5, donde 5 se refiere al último día 
de la fase preintervención y representa el punto de interrupción de la serie, y (2) la interacción entre la 
variable difdia y el programa pref, que llamaremos interac se obtiene calculando el producto entre los 
dos predictores. La serie temporal completa se muestra en la figura 11.12 (izquierda). 

La salida 11.14 emplea nuevamente el enfoque mixto con matriz de covarianza de identidad escala- 
da, que asume homogeneidad e independencia de las observaciones. Y en la misma línea del ejemplo 
11.3, cabe subrayar algunas pautas para la correcta interpretación de los resultados. 


SALIDA 11.14 
Análisis del ejemplo 11.4 con matriz IE mediante enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Identidad escalada (IE) 54.625 109.250 (5) 111.250 112.023 
Efectos aleatorios 
Parámetros Estimador E. típico Z de Wald P>|z| 
Varianza IE 25.137 8.887 2.828 .005 
Efectos fijos 
Fuentes de variación 8 lnum 8lden F P>F 
Constante 73.800 3.884 19.003 (16) .000 
pref 33.591 5.040 6.667 (16) .000 
difdia 7.100 1.585 4.478 (16) .000 
prefx difdia 7.557 1.614 -4.684 (16) | .000 


— El punto donde la fase pretratamiento concluye, para el que pref= 0 y difdia = 0, es la constante o 
intersección del modelo, que se estima en fp = 73.800 conductas distractoras. 


— La tendencia de la fase pretratamiento es el coeficiente $ = 7.100, o sea, se presenta durante la 
fase pretratamiento un incremento de 7.1 conductas perturbadoras por día, un incremento que 
resulta estadísticamente significativo: £(16) = 4.478; P <.001. 


— Se produce un cambio de nivel desde la primera a la segunda fase de magnitud $, = -33.591 uni- 
dades en la escala de la variable de respuesta, un cambio que resulta también estadísticamente 
significativo: 1(16) = -6.667;P < .001, lo que indudablemente revela la eficacia que ha produci- 
do la introducción del programa, puesto que pasa de 73.8 conductas perturbadoras al final de la 
primera fase a 73.800-33.591 = 40.209 al comienzo de la segunda. 


— Se produce un cambio de tendencia de la primera a la segunda fase de b3 = -7.557 unidades, que 
es también significativo; (16) = -4.684; P < .001. En consecuencia, puesto que la tendencia de la 
fase pretratamiento es $; = 7.100, puede calcularse la tendencia de la fase postratamiento con su 
combinación, 7.110 + (-7.557) = —0.457, una tendencia prácticamente nula, pero el cambio que 
se produce entre ambas fases es relevante. Las respectivas tendencias de las fases pre y postin- 
tervención son (véase figura 11.12 -derecha-), para la fase preintervención: cdist= 45.400 +7.10 
difdia y para la fase postintervención: cdist= 40.209 — 0.457 difdia. 


La salida 11.15 muestra los resultados del enfoque mixto con matriz de covarianza AR(1), que asume 
homogeneidad pero no independencia de las observaciones. 
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Figura 11.12b. — Conductas perturbadoras estimadas. 
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SALIDA 11.15 
Análisis del ejemplo 11.4 con matriz AR(1) mediante enfoque mixto 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Autoregresiva orden 1 (AR]) 53.886 107.773 (6) 111.773 113.318 
Efectos aleatorios 
Parámetros Estimador E. típico Z de Wald P>|lzl 
Varianza AR(1) 29.763 15.079 1.974 .048 
Rho (ARI) 0.346 0.303 1.144 .203 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 
Constante 75.168 4.772 15.753 (5.733) .000 
pref 36.387 5.477 6.625 (10.200) .000 
difdia 7.721 1.841 4.193 (8.228) .003 
pref x difdia -8.157 1.943 4.198 (6.305) .005 


Los resultados son muy similares para las dos matrices de covarianza. El ajuste condicional de la 
salida 11.16 muestra que no hay diferencias significativas entre los dos modelos, y por tanto la interpre- 
tación deberá abordarse con el modelo más simple, o sea, el modelo con matriz de covarianza TE. 


SALIDA 11.16 
Ajuste condicional de los modelos IE y AR(1) para el ejemplo 11.4 


Modelo 1: DSTI con matriz TE 
Modelo 2: DSTI con matriz AR(1) 


Desvianza 
109.250 


107.773 


11.4.3. Diseño de series temporales interrumpidas con GC no equivalente 


Una interesante ampliación del DSTI simple consiste en incluir, además del grupo experimental, 
un grupo de control, que no experimenta ningún programa o tratamiento, con la finalidad de valorar 
de forma más rigurosa si los cambios producidos entre las fases pre y postintervención son iguales en 
los dos grupos, que difieren en la presencia o ausencia de tratamiento. La estructura de este diseño se 
presenta en el cuadro 11.14. 


CUADRO 11.14 
Diseño de series temporales interrumpidas con grupo control no equivalente 
Asignación Pretest Postest 
NA YE. YEj YE¡+1» +» YEn 


NA Yc1,Yci Yoma Xen 


Ilustramos este diseño con un ejemplo tomado de un estudio de McAllister, Stachowiak, Baer y Con- 
derman (1969), que representa el ejemplo 11.5. Estos autores evaluaron si la aplicación de una contin- 
gencia de refuerzo disminuía la conducta perturbadora de niños de secundaria. Una profesora entrena- 
da impartió clases en dos unidades escolares de un mismo colegio, y tras un tiempo aplicó a una de las 
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unidades el programa de refuerzo (grupo experimental, ge) mientras la otra unidad (grupo control, gc) 
siguió su curso normal. Las respuestas de ambas unidades se registraron durante los 60 días que duró 
el programa de intervención (prog), los 26 primeros días que correspondieron a la fase preintervención 
y los restantes 34 a la fase postintervención. El cuadro 11.15 presenta el registro diario de las conductas 
perturbadoras para los grupos experimental y control. 


CUADRO 11.15 
Conductas perturbadoras en el aula (ejemplo 11.5) 


día | ge | gc | prog día | ge | gc | prog dia | ge | gc | prog día | ge | ge prog 
1 31 25 0 16 21 30 0 31 8 20 1 46 6 17 1 
2 24 | 25 0 17 30 16 0 32 10 | 31 1 47 5 27 1 
3 30 | 35 0 18 31 30 0 33 10 | 23 1 48 4 21 1 
4 15 19 0 19 11 | 24 0 34 8 16 1 49 4 22 1 
5 EF 17 0 20 27 26 0 35 7 15 1 50 4 21 1 
6 30 18 0 21 31 16 0 36 6 26 1 51 he 25 1 
Y ga 13 0 Ea 30 29 0 37 6 24 1 52 0) 22 1 
8 36 | 32 0 23 21.23 0 38 8 23 1 53 6 21 1 
g 28 16 0 24 a 0 39 8 16 1 54 5 20 1 
10 2 13 0 20 28.23 0 40 6 16 1 55 3 21 1 
11 18 | 20 0 26 30 30 0 41 8 18 1 56 4 21 1 
12 28 16 0 e 10 20 1 42 2 25 1 57 4 16 1 
13 44 | 22 0 28 11 15 1 43 6 22 1 58 2 17 1 
14 21 La 0 23 13 | 36 1 44 7 27 1 59 a 26 1 
15 me 16 0 30 10 18 1 45 0 20 1 60 0 28 1 


Nótese en este ejemplo la existencia de cuatro variables básicas, a saber: la serie temporal (día), el 
registro de las conductas perturbadoras (cper), que se representa en las columnas que corresponden a 
cada grupo (ge y gc) y el programa (prog) diario seguido, que representa en esencia la pertenencia a uno 
de los dos grupos, ge, al que se administró el programa de refuerzo el marco de la clase durante la fase 
postintervención, y gc que siguió la actividad escolar cotidiana en ambas fases. Como en el caso ante- 
rior, nuevamente es necesario diferenciar la serie temporal respecto del punto donde la interrupción y 
la introducción del programa se produce, en concreto después de 26 días de registro cotidiano similar 
en los dos grupos (difdia = día—26) y la asignación del tratamiento (durante los días 27 a 60). 

El análisis estadístico de este diseño no plantea mayores problemas. El objetivo principal es la com- 
paración de la serie temporal observada en el GC, donde no se espera cambio de nivel, con la serie 
temporal observada para el GE, donde se espera un cambio de nivel estadísticamente significativo. Las 
figuras 11.13a y 11.13b muestran la serie temporal observada para cada uno de los dos grupos, con las 
rectas de regresión estimadas en línea discontinua. Obsérvese la notable similitud del registro de con- 
ductas perturbadoras en los dos grupos en la fase preintervención y el abrupto cambio de nivel produ- 
cido en el GE durante la fase postintervención. 

El proceso analítico requiere estimar dos modelos: en primer lugar un modelo que incluya, además 
de los componentes considerados en el DST I simple, el efecto diferencial de la pertenencia a grupo, y en 
segundo lugar el mismo modelo anulando el efecto de grupo. Asumiendo que se cumplen los supuestos 
de homogeneidad de las varianzas e independencia de las observaciones, la salida 11.17 presenta los 
resultados del primer modelo, que incorpora el efecto diferencial de grupo, utilizando el enfoque mixto 
con matriz de covarianza JE. 
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Figura 11.13b. — Conductas perturbadoras en el GE. 
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SALIDA 11.17 
Análisis del ejemplo 11.5 con efecto de grupo y matriz IE 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Identidad escalada (IE) 403.366 806.731 (6) 812.476 811.476 
Efectos aleatorios 
Parámetros Estimador E. típico Z de Wald P>|z| 
Varianza IE 50.945 6.718 7.583 .000 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 
Constante 28.980 2.031 14.268 (115) .000 
prog -9.114 2.614 3.486 (115) .001 
difdia 0.088 0.132 0.667 (115) .506 
prog x difdia -0.223 0.159 —1.405 (115) |  .163 
grupo 7.567 1.303 5.807 (115) .000 


A destacar el importante efecto diferencial de grupo, que resultó significativo, £(115) = 5.807; P < 
.001, lo que apunta que el programa de tratamiento mediante contingencias de refuerzo ha sido efec- 
tivo para reducir las conductas perturbadoras en el marco del aula. De hecho, el efecto del programa 
puede combinarse con el efecto de grupo para valorar el cambio de nivel: —9.114 + (-7.567)=-16.681. El 
segundo modelo, que prescinde del efecto diferencial de grupo, se muestra en la salida 11.18. 


SALIDA 11.18 
Análisis del ejemplo 11.5 sin efecto de grupo y matriz IE 
Estructura de covarianza Loglik Desvianza (q) AIC BIC 
Identidad escalada (IE) 420.459 838.918 (5) 840.918 843.671 
Efectos aleatorios 
Parámetros Estimador E. típico Z de Wald P>|lz| 
Varianza IE 65.313 8.576 7.616 .000 
Efectos fijos 
Fuentes de variación 8lnum 8lden F P>F 
Constante 25.197 2.178 11.5673 (116) .000 
prog -9.114 2.960 3.079 (116) .003 
difdia 0.088 0.149 0.589 (116) 557 
progx difdia 0.223 0.180 -1.241 (116) | .217 


El ajuste condicional de modelos determina si hubo o no efecto significativo de grupo comparando 
los modelos de las salidas 11.17 y 11.18. La salida 11.19 permite finalmente concluir mediante ajuste 
condicional que es mejor el modelo más complejo, o sea, el modelo con efecto de grupo. 


SALIDA 11.19 
Ajuste condicional de dos modelos con matriz IE para el ejemplo 11.4 
Modelo 1: DSTIG sin efecto de grupo 
Modelo 2: DSTIG con efecto de grupo 
Modelo | Desvianza 
1 838.918 


2 806.731 
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11.4.4. Algunos ejemplos publicados con el DSTI 


Hay bastantes ejemplos publicados con el diseño DSTI, muchos de ellos asociados con investi- 
gaciones de caso único que trataremos en el capítulo siguiente. Un interesante ejemplo de aplicación 
puede consultarse en Powell y Newgeny (2010). 

Rimondini et al. (2010) diseñaron una investigación para evaluar la efectividad del entrenamiento 
en entrevistas centradas en el paciente sobre el desarrollo de una entrevista a residentes psiquiátricos. 
Para ello seleccionaron a N = 10 residentes, cada uno de los cuales entrevistó a 12 pacientes estanda- 
rizados diferentes, 8 antes y 4 después del entrenamiento. Los pacientes estandarizados simularon ser 
pacientes que atendían su primera visita a una clínica psiquiátrica. Las consultas fueron grabadas en ví- 
deo, transcritas y codificadas con un esquema de clasificación, del que derivó un índice de rendimiento. 
Se empleó un diseño DSTT con un grupo y análisis multinivel para explorar la tendencia. Los resulta- 
dos evidenciaron una tendencia horizontal antes y después del entrenamiento, con un cambio de nivel 
significativo. Los investigadores controlaron la presencia de efectos de práctica y encontraron un efecto 
de entrenamiento estadísticamente significativo. 

Por su parte, May y Supovitz (2006) se propusieron evaluar el impacto del sistema comprensivo de 
reforma escolar American's Choice sobre el aprendizaje de los estudiantes con un estudio longitudinal de 
11 años (6 años antes de la implantación del sistema y 5 años después). Durante este periodo se emplea- 
ron 55000 estudiantes de grados 1 a 8 en 42 escuelas elementales y 10 intermedias de Rochester (New 
York), que fueron evaluados en lectura y matemáticas. Los autores emplearon un diseño DST I tomando 
como respuesta la ganancia anual en rendimiento académico de los estudiantes enrolados con el siste- 
ma comprensivo de reforma de Rochester (grupo experimental) contra los estudiantes de Rochester de 
escuelas no enrolados con el sistema (grupo de control). El análisis estadístico fue muy complejo, pero 
los resultados apuntaron efectos anuales significativos, acumulativos a lo largo del tiempo, en los grados 
elementales e intermedios tanto en lectura como en matemáticas. 


11.5. SUGERENCIAS DE ESTUDIO 


Aunque algo antiguo, es todavía muy aprovechable la lectura de una monografía de Judd y Kenny 
(1981a) sobre los efectos de intervenciones sociales. Muchas de las ideas apuntadas en este capítulo 
tienen su origen en él. También puede resultar de interés la consulta de la página Web Center for Social 
Research Methods, mantenida por el profesor Trochim, que dispone de una base de conocimiento en la 
forma de un hipertexto sobre investigación social aplicada (URL: www.socialresearchmethods.net/kb/). 

Los fundamentos metodológicos de los diseños cuasiexperimentales pueden consultarse en Sha- 
dish et al. (2002), que representa la referencia más completa y el último exponente de una tradición 
cuasiexperimental iniciada por Campbell y Stanley en 1969 y seguida por Cook y Campbell en 1979. 

Los diseños con grupo control no equivalente tienen una abundante literatura que se ha centrado 
sobre todo en las opciones analíticas disponibles. Puede consultarse a este respecto Bonate (2000) y en 
español Ato (1995a) y Bono (2012). El diseño de discontinuidad de la regresión ha recibido mucha aten- 
ción recientemente en otras áreas, de donde cabe destacar aportaciones metodológicas como Imbens y 
Lemieux (2008). Otras referencias de interés incluyen Lesik (2011) y Reichardt y Henry (2012). 

Los diseños de series temporales interrumpidas tienen también un amplio respaldo bibliográfico. 
Una referencia breve, pero asequible, sobre este diseño es Velicer y Fava (2003). Una referencia más 
general es McCleary y McDowall (2004). En español recomendamos la consulta de una monografía de 
Vallejo (1996). 
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12.1. INTRODUCCIÓN 


Los diseños clásicos, basados en la tradición del control estadístico (ENFOQUE NOMOTÉTICO), siguen 
siendo normativos en la literatura psicológica. Todos ellos constituyen un buen ejemplo del proce- 
der bajo el paraguas hipotético-deductivo y participan del afán generalizador propio de las ciencias 
nomotéticas. Sin embargo, con el devenir de los años ha vuelto a cobrar actualidad el interés que du- 
rante las últimas décadas del siglo XIX y las primeras del siglo XX tuvieron los pioneros de la psicología 
(Broca, Donders, Ebbinghaus, Fechner, James, Kohler, Muller, Pavlov, Titchener, Watson, Wundt o Yer- 
kes) por la metodología basada en el estudio prolongado de la conducta de un mismo organismo, es 
decir, por los diseños basados en la tradición del control experimental (ENFOQUE IDIOGRÁFICO). Aunque 
de una u otra forma, el interés por la observación y el análisis repetido del comportamiento individual 
siempre ha estado vigente en nuestra disciplina. 

El enfoque nomotético ha dominado la investigación psicológica desde que en los años 30 del siglo 
pasado los métodos de estimación y de contraste de hipótesis comenzaran a desarrollarse y perfeccio- 
narse. Los investigadores que usan este enfoque exponen a dos o más grupos de sujetos (configurados al 
azar o conformados de antemano) a las diferentes condiciones de una o más variables independientes 
y, tras recoger las puntuaciones promediadas de los distintos miembros de cada grupo, se comparan las 
varianzas intergrupales con la intra-grupal para determinar la probabilidad que tienen las diferencias 
obtenidas de acontecer por azar. Por el contrario, los investigadores que utilizan el enfoque idiográfico 
no se centran en la variabilidad existente dentro de la muestra, ni en los promedios grupales, sino que las 
respuestas de los participantes son cuidadosamente examinadas a través de un período relativamente 
prolongado de tiempo. En los diseños clásicos las respuestas de los sujetos individuales se pierden en el 
proceso de promediar grupos y los hallazgos importantes son oscurecidos. Las inferencias acerca de los 
cambios se hacen a nivel grupal, descuidando los posibles efectos de la intervención sobre cualquier su- 
jeto individual. Esto limita gravemente la aplicabilidad de los resultados a sujetos específicos (Barlow y 
Hersen, 1984). Además, a menudo con los diseños clásicos no es posible obtener información adicional 
sobre la naturaleza dinámica de la respuesta al tratamiento, ya que muchas veces tan sólo incorporan 
una sola medición. 

A pesar del evidente interés a lo largo de la historia por el estudio del comportamiento individual, 
la necesidad de medir de forma objetiva y repetida la conducta de un solo organismo bajo condiciones 
altamente controladas descansa en la metodología del condicionamiento operante desarrollado por 
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Skinner (1938). Para este autor la variabilidad que se observa en la conducta no es inherente a la misma, 
sino que se debe a factores estimulares (internos o externos) que la determinan. La vía propuesta por 
Skinner para su control, no sólo exige conocer cómo se relacionan las variables extrañas con las varia- 
bles dependientes, también requiere saber cuántas variables extrañas afectan a la conducta y cuáles son 
las más relevantes. La base para el establecimiento de relaciones funcionales/causales no radica en uti- 
lizar el acto físico de la aleatorización, con el objeto de mantener constantes los efectos nocivos de las 
variables extrañas, sino en controlarlas de forma directa y rigurosa con procedimientos experimentales. 

Como destaca Baron (1990), con el paso de los años, la metodología desarrollada por Skinner y co- 
laboradores dentro del laboratorio fue sistematizada por Sidman (1960), e incorporada paulatinamente 
al tratamiento clínico de pacientes humanos con el nombre de TERAPIA DE CONDUCTA. Aunque la obra 
de Sidman fue decisiva en la elaboración y sistematización de los primeros DISEÑOS DE CASO ÚNICO, 
DCU ( consúltese al respecto el excelente trabajo de Johnston y Pennypacker, 2009), no debemos pasar 
por alto el gran esfuerzo llevado a cabo por los usuarios de la terapia de conducta. Al querer demostrar 
la efectividad de sus tratamientos, muchos investigadores se han visto en la necesidad de perfeccionar 
y desarrollar los diseños iniciales hasta el nivel alcanzado actualmente. Como consecuencia, durante 
más de cinco décadas los estudios con DCU han proporcionado evidencias sólidas de los efectos del 
tratamiento en campos de investigación tan diversos como el biomédico, el escolar, la modificación de 
conducta, la psicología básica y la educación especial (Kratochwill et al., 2010). 

El debate hoy en día no se centra en discutir el estatus científico del enfoque idiográfico, sino en 
saber cuál de los diferentes DCU existentes, que aparecen bajo una gran variedad de nombres en la 
literatura (diseños conductuales, diseños de reversión, diseños de replicación intrasujeto, diseños expe- 
rimentales intrasujeto, diseños con N = 1, diseños de series de tiempo interrumpidas, diseños de series 
temporales cortas, investigación con organismo individual o experimento de sujeto único), constituye 
la mejor estrategia para establecer relaciones funcionales entre las variables que entran a formar parte 
de la hipótesis causal. De hecho, una búsqueda en el Índice de Citas de Ciencias Sociales de la Web of 
Science con las palabras clave 'caso único' o 'sujeto único” muestra un aumento considerable en el nú- 
mero de artículos publicados en las últimas décadas. Desde la década de los 90 hasta hoy, el número de 
trabajos publicados sobre esta temática ha pasado de ser inferior a cien por año a más de setecientos. 

Al igual que ocurre con los diseños clásicos, en este área también puede hacerse una distinción en- 
tre DCU experimentales y cuasi-experimentales. Con los primeros es factible la asignación aleatoria de 
las ocasiones de medición a los tratamientos, mientras que con los segundos no resulta factible dicha 
asignación. Estos diseños no deben confundirse con otros estudios de corte longitudinal, tales como 
los diseños comparativos longitudinales o los diseños observacionales. En la investigación observacio- 
nal de series de tiempo también se efectúan mediciones repetidas, pero no se introducen tratamientos 
planificados. Los DCU se caracterizan por la manipulación activa del tratamiento por parte del inves- 
tigador. Los DCU y los diseños comparativos longitudinales, que se tratan en el capítulo 13, tienen en 
común que los sujetos se miden repetidamente a lo largo del tiempo, aunque los diseños comparativos 
longitudinales miden a los sujetos durante periodos de tiempo más largos (meses o incluso años) que los 
DCU (días o semanas). Además, en un DCU uno o más sujetos (en la actualidad, más de un participante 
suele ser incluido en el estudio) pueden estar involucrados, mientras que en los diseños longitudinales 
se observa simultáneamente a múltiples sujetos a través del tiempo (Verbeke y Molenberghs, 2009). 

En las siguientes secciones de este capítulo se comentan algunas de las características más relevan- 
tes de estos diseños, se efectúa una clasificación de las diversas modalidades de diseño existentes y se 
describen las ventajas e inconvenientes de los más representativos. Finalmente, se aborda la inspección 
visual de los datos representados gráficamente y el análisis estadístico de los mismos. 
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12.2. CARACTERÍSTICAS DE LOS DISEÑOS DE CASO ÚNICO 


El objetivo principal de este tipo de diseños radica en evaluar si existe una relación causal/funcional 
entre la introducción de un tratamiento y el cambio operado en la respuesta o variable dependiente. 
Para alcanzar dicho objetivo, la respuesta de una unidad de análisis, la cual puede ser un participante 
o un grupo reducido de participantes, se registra repetidamente a lo largo del tiempo bajo condiciones 
estimulares altamente controlados. A continuación, las respuestas dadas en la variable de interés antes 
de la intervención se comparan con las respuestas obtenidas durante (y después) de la intervención 
(Barlow, Nock y Hersen, 2009; Kratochwill y Levin, 2010; Kazdin, 2011). 

Una de las principales características de los DCU lo constituye su ÉNFASIS EN EL SUJETO INDIVIDUAL. 
En el caso de que varios participantes estén implicados en el estudio, el examen de los datos es enfocado 
mediante el análisis de la variabilidad individual, más que a través del análisis de la variabilidad grupal. 
Los estudios que usan DCU proporcionan información detallada acerca de las variaciones que el efecto 
del tratamiento provoca en la respuesta de un número específico de sujetos. Tal información tiende a 
perderse en los diseños que emplean dos o más grupos de comparación (diseños clásicos), pues estos 
últimos sólo proporcionan promedios y tamaños del efecto para todo el grupo (Barlow y Hersen, 1984). 
En la figura 12.1, inspirada en Sheridan (1979), se ilustra cómo la ejecución promediada de un grupo de 
sujetos puede oscurecer el patrón de respuestas individuales. 


| Sujeto 1 | Sujeto 2 ' ujeto 3 L 4 e 5 


100 100 
so 50 
is Curva grupal 
Sujeto 7 Sujeto 8 
0 


o 


Figura 12.1. — Ejecución individualizada y promediada de ocho sujetos. 


Otra característica de los DCU lo constituye el esfuerzo realizado por sus defensores en el control 
manipulativo de la variabilidad. Un aspecto básico de este proceso lo constituye la LÍNEA BASE, O fase 
en la que se efectúan múltiples registros de la respuesta de un mismo sujeto en ausencia de tratamiento. 
Esta fase, además de permitir realizar comparaciones formales con el fin de evidenciar los efectos del 
tratamiento, también sirve como elemento clave para el control de la variabilidad inherente a los su- 
jetos. Para lograr ambas metas, Sidman (1960) aconseja alcanzar la estabilidad de la respuesta en línea 
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base antes de que se produzca un cambio de fase. Alcanzar la estabilidad, no sólo facilita describir la 
conducta, sino también pronosticar su evolución. Las técnicas de control experimental basadas en la 
eliminación y la constancia (véase sección 6.2.2 del capítulo 6) son especialmente adecuadas aquí. 

Una tercera característica definitoria delos DCU lo constituye su ESTRUCTURA SECUENCIAL. Es decir, 
una misma unidad es medida repetidamente a lo largo del tiempo antes de administrar el tratamiento 
(fase A) y después de administrarlo (fase B). La fase A se refiere a la línea base o condición control. 
La fase B se refiere a la condición experimental y en teoría comienza una vez que se ha alcanzado el 
criterio de estabilidad previamente establecido. Durante esta fase, el investigador procede a aplicar la 
variable independiente (intervención, programa o simplemente tratamiento) y continúa observando 
las respuestas de los sujetos, manteniendo constantes todos los demás aspectos que intervienen en la 
investigación. Según los defensores del tratamiento guiado por la respuesta, esta fase, al igual que la 
de línea base, se prolonga hasta que emerja un patrón conductual inequívoco. El tratamiento dado a 
los participantes implica un programa de refuerzo, un método de estudio, una determinada terapia o 
cualquier otro factor estimular que resulte de interés. A su vez, el tipo de conductas objetivo seleccio- 
nadas a priori o tras un período de valoración inicial es numeroso; no obstante, los registros motrices, 
fisiológicos y verbales suelen ser los más frecuentes. 

Finalmente, los DCU también se caracterizan por su fácil REPLICABILIDAD y también por su gran 
FLEXIBILIDAD. En relación con la primera, señalar que para los defensores de estos diseños la capacidad 
de generalizar los resultados a otros sujetos (validez de población), a otros contextos (validez ecológica) 
y a otras ocasiones temporales (validez histórica) es un asunto de carácter conductual más que lógico 
y, por tanto, es un problema de constatar hechos; es decir, se trataría de añadir vigor al rigor mediante 
algún programa de replicación directa (repitiendo el experimento de forma exacta), sistemática (modi- 
ficando alguna condición) y clínica. Por lo que respecta a la segunda característica, Sidman (1960) nos 
recuerda que los DCU, a diferencia de los diseños clásicos, no tienen reglas fijas, y de aquí que se puedan 
efectuar modificaciones (p.ej., aumentando el número de cambios de fase) a lo largo de la investigación. 


12.3. TIPOS DE DISEÑOS DE CASO ÚNICO 


Existen múltiples tipos de DCU y también varias estrategias de clasificación posibles (véase Arnau, 
1995b; Hayes, 1981; Kratochwill, 1992). Una manera sencilla de clasificar los tipos de DCU considera los 
dos criterios básicos que siguen: (1) la reversibilidad (o no reversibilidad) de la respuesta a los niveles 
basales tras retirar el tratamiento y (2) la estrategia de comparación empleada para inferir la efectividad 
del tratamiento (las comparaciones se efectúan dentro de una misma serie —intra series—, a través de 
las series —entre series— o combinando ambas estrategias —series mixtas—). De acuerdo con estos dos 
criterios básicos de clasificación, en el cuadro 12.1 aparecen recogidos los principales DCU. 

Recientemente, Shadish y Sullivan (2011) han realizado una revisión sistemática de los DCU publi- 
cados en el campo de la Psicología y de la Educación en el año 2008, y han encontrado que más de la 
mitad de los estudios evaluados usaban los DLBM (54,3%), seguidos por los diseños de reversión y los 
DTA (con 8.2% y 8%, respectivamente). Estas tres modalidades de DCU implican la repetición de fases, 
lo cual permite controlar las principales amenazas a la validez interna, incluyendo la historia y la madu- 
ración (Shadish et al., 2002). En lo que resta de este apartado nos centraremos en revisar estos diseños, 
así como el diseño A— B por constituir la base de los mismos. 
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CUADRO 12.1 
Clasificación de los diseños de caso único 


Diseño de 2 fases (4— B) 
Diseño de reversión de 3 fases (4A— B-— A) 
Diseño de reversión de 3 fases con RDO (4- B- A-RDO) 
Diseño de reversión de 4 fases (4A— B— A-— B) 
Intra series 4 Diseño de inversión de 4 fases (A— B— A] — B) 
Diseños reversibles Diseño de retirada (B— A- B) 
Diseño de reversión multinivel (A— B1- A-B2) 
Diseño de tratamiento múltiple (A— B- A-C-A) 
Diseño de interacción (4A- B- A-B-BC-B-BC) 


. . Diseño de reversión de 4 fases de inversión 
Series mixtasg__. _ y A 
Diseño de reversión de 4 fases de generalización 


Intra series [Diseño de cambio de criterio 
Diseño de tratamientos alternantes (DT A) 


Entre series4_.. _ . . y 
Diseño de tratamientos simultáneos (DTS) 


Diseños no reversibles 
Diseño de línea base múltiple entre conductas (DLBM1) 
Series mixtas 4 Diseño de línea base múltiple entre participantes (DLB M2) 


Diseño de línea base múltiple entre contextos (DLB M3) 


12.3.1. Diseños intra-series de estructura simple 


El esquema más básico es el DISEÑO A— B con una sola unidad de análisis en la cual se efectúan 
múltiples mediciones periódicas, en un esfuerzo por establecer una línea base en la respuesta, que no 
cambia de un período de observación a otro (estabilidad) o hasta que emerja un patrón conductual 
(p. ej., una tendencia). Eventualmente se introduce un tratamiento en la serie, y se determina si se ha 
producido algún cambio como consecuencia de la intervención. Patrones de cambio que resultan muy 
familiares a los investigadores son los cambios en el nivel y en la tendencia de la serie antes y después de 
administrar el tratamiento (véase figura 12.2). Para conocer si la intervención provoca algún cambio en 
la respuesta, es común representar gráficamente los datos (Barlow et al., 2009, Kratochwill ef al., 2010; 
Kazdin, 2011). 


Línea Base Tratamiento 


Respuesta 


8 9 


Sesiones 


Figura 12.2. — Representación de un diseño A— B con datos ficticios. 
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En la figura 12.2, durante la fase A las puntuaciones de respuesta se mantienen relativamente estables, 
mientras que durante la fase B se observa un cambio en el nivel y en la pendiente de la serie. 

Dentro de esta clase de diseños, la unidad que es asignada a las condiciones experimentales es una 
medida o punto de la serie, no una persona o grupo de personas como sucede en los diseños clásicos. 
Aquí los N puntos de la serie temporal son asignados a la fase de control y a la fase experimental. La 
asignación de los puntos de la serie a la fase B puede realizarse mediante un proceso de aleatorización 
restringida o, como suele ocurrir en la práctica, mediante un proceso carente de aleatorización. En el 
primer caso, se determina al azar el cambio de fase o punto de intervención dentro de la secuencia, 
mientras que en el segundo la administración del tratamiento está guiada por las respuestas. En los 
contextos de investigación aplicados, el verdadero experimento no siempre es fácil de implementar y 
se debe acudir al cuasi-experimento. Bajo esta última situación, el diseño A— B no permite concluir de 
manera inequívoca que el cambio observado en la respuesta se deba al tratamiento, en lugar de algún 
otro evento externo que pudiera haber ocurrido al mismo tiempo (Shadish et al., 2002). Esta limitación 
se suele abordar utilizando DCU más complejos, tales como los diseños de línea base múltiple (DLBM), 
los diseños de reversión y los diseños de tratamientos alternantes (Barlow et al. , 2009). 

A pesar de que la validez interna (inferencial) del diseño A— B está condicionada a poder determinar 
de antemano el número de sesiones (ocasiones de medida, periodos de observación o puntos tempora- 
les) en las que los tratamientos serán aplicados, así como el número mínimo de veces que lo será cada 
condición específica de tratamiento, el diseño puede ser de gran utilidad en investigaciones de carácter 
exploratorio, cuando existan serias dudas acerca de la reversibilidad de la conducta o cuando no sea 
factible implementar diseños de mayor complejidad. 


12.3.2. Diseños reversibles intra-series 


La presentación y la retirada del tratamiento es típico de los DISEÑOS DE REVERSIÓN, por ejemplo, 
del DISEÑO A— B— A— B. En este tipo de diseños, hay varias transiciones de una fase a otra dentro de 
un mismo sujeto. Cuando se observa un cambio en la respuesta tras la presentación del tratamiento 
durante cada par de fases A— B, aumenta la confianza de que dicho cambio se deba al tratamiento y 
no al efecto de algún evento externo. En concreto, el diseño de reversión A— B— A— B nos brinda tres 
oportunidades para demostrar la efectividad del tratamiento: una, coincidiendo con su presentación, 
otra con su retirada o fase crítica y la tercera a raíz de su reinstauración. 
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Figura 12.3. — Datos hipotéticos para un diseño A- B- A-B. 
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En la figura 12.3 el segmento de observaciones que va de la sesión primera a la vigésimo primera nos 
permite evaluar el efecto de la presentación del tratamiento, el segmento que va de la sesión duodécima 
a la trigésimo primera nos permite evaluar su retirada, mientras que el segmento que va de la sesión 
vigésimo segunda a la cuadragésimo primera nos permite evaluar de nuevo la presentación por segunda 
vez del tratamiento. Aunque los diseños de reversión proporcionan un alto grado de control, son fáciles 
de implementar y no suelen presentar limitaciones éticas, ya que es común que concluyan en fase de 
tratamiento, pero no siempre es posible asumir la reversibilidad de la conducta. Por ejemplo, cuando el 
objetivo es aprender un nuevo comportamiento, éste no se puede revertir. 

Existen distintas variaciones del formato A— B-— A— B. Una modalidad básica lo constituye el DISEÑO 
A—B- A1-—B. Esta nueva versión del diseño de retirada de cuatro fases se presta muy bien a la realización 
de estudios sobre drogas. La fase A1 corresponde al registro de la conducta bajo la acción de un placebo 
O falso tratamiento, lo que permite controlar la reactividad de un sujeto. Dentro de este tipo de diseños 
existen distintas estrategias, pero en todas ellas durante la fase A1 se le hace creer al sujeto que está 
recibiendo cierta dosis de alguna sustancia activa, mientras que en realidad sólo recibe una sustancia 
inerte o alguna otra que, a ciencia cierta, no tiene ningún efecto sobre la conducta. El uso de esta fase 
de control placebo u operación fingida también es de gran utilidad en los estudios psicofisiológicos y en 
aquéllos en los que están inmersos aspectos relativamente novedosos. 

Otra variedad del diseño A— B-— A-— B de reversión que puede resultar de interés, es el DISEÑO 
A—B-C-B, donde A es la línea base, B corresponde al tratamiento administrado contingentemente a 
la conducta de interés y C también corresponde al tratamiento, pero aquí no se mantiene la relación de 
contingencia con la conducta, es decir, se aplica con independencia de que se emita o no la conducta 
deseada. Repárese que desde el punto de vista físico las fases B y C son idénticas, aunque difieren clara- 
mente desde el punto de vista psicológico. Bajo este diseño la fase C sirve de control del incremento de 
la atención que recibe el sujeto en la fase de tratamiento (C es análoga a 41). Dado que las fases A y C 
no son equiparables, el principal análisis dentro de esta estrategia consiste en comparar B-— C- B, esto 
es, la administración del tratamiento contingente versus no contingente. 

Por último, conviene resaltar que existen diseños reversibles que presentan una estructura algo más 
compleja. De ellos destacamos los DISEÑOS DE TRATAMIENTO MÚLTIPLE, que son diseños que permiten 
evaluar dos o más variables de tratamiento por separado (p. ej., A-B- A—C- A, A-B- A-C-A-D 
A), los DISEÑOS MULTINIVEL, o diseños que examinan distintas variaciones de una misma variable de 
tratamiento (p. ej., A-B1- A-B2- A, A- B- A- B- B1- B2- B3) y los diseños interactivos o diseños 
que estudian la interacción entre dos o más variables de tratamiento (p. ej., A-B- A-B-BC-B-BC, 
A-B- A-C-BC-D-BD-CD- BCD). Para poder valorar correctamente la interacción de dos o 
más variables se deben analizar los efectos las variables implicadas en el diseño separadamente y en 
conjunto, respetándose la regla básica de no cambiar más de una variable al mismo tiempo cuando se 
pasa de una fase a otra. Esta regla conviene complementarla con la conveniencia de manipular cada 
variable por separado antes de hacerlo conjuntamente. Más detalles acerca de esta modalidad y otras 
modalidades de diseños se ofrecen en Arnau (1995b), Vallejo y Ato (2007) y Bono y Arnau (2014). 


12.3.3. Diseños no reversibles entre-series 


En ocasiones los investigadores están interesados en saber si un determinado tratamiento trabaja 
bien, y en caso afirmativo, si lo hace mejor que otros. Los DISEÑOS DE TRATAMIENTOS ALTERNANTES 
(DT A), que también aparecen referidos en la literatura con el nombre de DISEÑOS MULTI-ELEMENTO, 
permiten responder a la cuestión planteada (Hayes, 1981; Kratochwill y Levin, 2010). En un DTA típico, 
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la recogida de datos comienza con una fase de control (fase A) y después, durante la fase experimental 
(fase B), dos o más tratamientos diferentes se alternan rápidamente (véase figura 12.4). 
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Figura 12.4. — Datos hipotéticos para un diseño DTA 


Los DTA tienen la ventaja de que los tratamientos no tienen que ser retirados, la línea basal no es 
imprescindible que sea estable y permite la comparación de los diferentes tratamientos en un período 
relativamente breve de tiempo (o en un reducido número de sesiones). Sin embargo, este tipo de dise- 
ños sólo es apropiado cuando sea posible la alternancia de los tratamientos. Además, no es descartable 
que ocurran efectos residuales del periodo (efectos carry-over) debido a que la variable dependiente 
está expuesta a la acción de dos o más variables de tratamiento, en cuyo caso podría cuestionarse que 
los tratamientos de por sí tuviesen el efecto para el que fueron concebidos. Para asegurarse que el tra- 
tamiento elegido es eficaz por si mismo, y evitar posibles problemas interpretativos, se aconseja incluir 
una fase final en el diseño donde sólo se implemente el tratamiento seleccionado. 


12.3.4. Diseños no reversibles de series combinadas 


Los DISEÑOS DE LÍNEA BASE MÚLTIPLE (DLB M) constituyen la principal alternativa a los diseños de 
reversión cuando se pretende evaluar el efecto de la intervención. Estos diseños conllevan aplicar el 
mismo tratamiento en distintos momentos temporales a diferentes condiciones de línea base, y deter- 
minar si una condición que no está bajo el control del tratamiento cambia a lo largo de una que sí está 
controlada (Shadish y Sullivan, 2011). El razonamiento lógico que subyace a estos diseños se basa en 
poder desestimar posibles hipótesis rivales, demostrando que el cambio conductual no tiene lugar has- 
ta que el tratamiento es presentado en el punto de interés. Al mismo tiempo, el resto de las conductas, 
que se suponen independientes (supuesto de independencia), permanecerán estables y sin cambios 
hasta que el tratamiento se aplique en el punto de intervención seleccionado. Para potenciar la validez 
interna de los DLBM, el principio de independencia se debe complementar con el de sensibilidad; esto 
es, se requiere que todas las conductas registradas manifiesten el mismo grado de sensibilidad ante la 
influencia de factores que puedan oscurecer la efectividad del tratamiento. En función de la naturaleza 
de la línea base resulta común formular tres tipos básicos de DLBM, a saber: 
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1. DLBM ENTRE CONDUCTAS. En estos diseños, los datos de las líneas base del mismo participante 
se recopilan para dos o más conductas objetivo diferentes. Una vez establecidas las líneas base, el 
investigador aplica el tratamiento a cada una de ellas en momentos diferentes. La primera con- 
ducta que está sujeta al tratamiento debe ser activada, mientras las conductas restantes se man- 
tienen en sus niveles estables. Cuando las tasas son otra vez estables para todas las conductas, el 
tratamiento se aplica a la segunda conducta, y así sucesivamente. La efectividad del tratamiento 
experimental se demuestra cuando el cambio de conducta está asociado en cada caso a la presen- 
tación de dicho tratamiento. 


2. DLBM ENTRE CONTEXTOS. Este tipo de diseños implican la recogida de conductas objetivo y la 
aplicación secuencial del tratamiento, cuando el sujeto está respondiendo a diferentes aspectos 
de un mismo ambiente, o cuando está respondiendo en dos o más situaciones, tales como la es- 
cuela y el hogar. Como en el caso anterior, el efecto específico del tratamiento queda demostrado 
si la conducta cambia en una situación particular sólo cuando el tratamiento es introducido con- 
tingentemente. 


3. DLBM ENTRE PARTICIPANTES. Este diseño sigue el mismo procedimiento que los anteriores, sólo 
que en este caso se registra la conducta objetivo de dos o más sujetos. El diseño elimina la difi- 
cultad que implica seleccionar dos o más conductas mutuamente independientes, de modo que 
cuando se aplique el tratamiento a una de ellas no cambien las otras. Otra razón más que añadir 
para usar este diseño, tiene que ver con el hecho de que una persona puede tener sólo una con- 
ducta que necesite ser tratada. Incluso en el caso de que tuviera más de una, podría ocurrir que el 
mismo tratamiento no resultase funcional para todas ellas. 


Un estudio realizado por McClannahan, McGee, MMcDuff y Krantz (1990) servirá de ejemplo para 
ilustrar lo dicho. Con el propósito de evaluar la eficacia de un programa destinado a mejorar la higiene de 
12 niños autistas institucionalizados y realojados para la ocasión en tres centros terapéuticos diferentes 
(con 5, 3 y 4 niños respectivamente), los autores utilizaron un DLBM entre participantes. En el primer 
centro, el tratamiento se implementó bajo condiciones de demora temporal de 6 días, en el segundo 
de 10 y en el tercero de 16. El tratamiento consistió en proporcionar refuerzo social por parte de los 
cuidadores; en concreto, los monitores realizaban comentarios positivos acerca de la apariencia de los 
niños y elogiaban la importancia de una buena higiene y de un esmerado cuidado personal. La variable 
dependiente consistió en una medida de los hábitos higiénicos obtenida a partir del cuestionario PAI 
(Personal Appearance Index). En la figura 12.5 aparecen recogidas las puntuaciones promediadas de 
aspecto personal obtenidas para los niños residentes en uno de los tres centros terapéuticos. Como se 
puede apreciar, se produce un incremento en los valores de la respuesta para los tres sujetos cuando se 
introduce el tratamiento, con independencia del momento temporal en el que se administre; por ende, 
es razonable atribuir el cambio observado al tratamiento y no a algún otro factor externo. 

Los DLBM pueden ser considerados como una serie escalonada de diseños A— B, en los que el in- 
vestigador lleva a cabo el registro temporal de distintas conductas de un mismo sujeto, de la conducta 
de un sujeto en distintos ambientes o de la conducta de múltiples sujetos, e introduce el tratamiento de 
manera secuencial a las diferentes conductas, situaciones o sujetos. Sin embargo, estos diseños consti- 
tuyen una clara mejoría de los diseños A— B, ya que posibilitan que la línea de base tenga longitudes 
diferentes (véase figura 12.5). Como consecuencia, los investigadores no necesitan retirar el tratamiento 
para obtener resultados internamente válidos (Barlow et al., 2009; Koehler y Levin, 2000). Por otra parte, 
debido a que el DLBM se repite para varios sujetos (conductas o ambientes), la validez externa relativa 
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a la efectividad de un tratamiento también puede ser examinada. Si se encuentra que el tratamiento es 
eficaz para un grupo de sujetos (conductas o ambientes), la validez externa se incrementará. También 
puede darse el caso de que el tratamiento no sea eficaz para todos los sujetos (conductas o ambientes), 
lo que lleva a intentar detectar la presencia de variables moderadoras. En general, se necesitan más de 
tres sujetos para examinar las validez externa y para detectar la presencia de variables moderadoras. 
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Figura 12.5. — Datos tomados con modificaciones de la figura 3 de McClannahan et al. (1990) 
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12.4. ANÁLISIS DE DATOS EN LOS DISEÑOS EXPERIMENTALES DE 
CASO ÚNICO 


Aunque se han propuesto diversos métodos cuantitativos para analizar los DCU, aún son muchos 
los investigadores que basan sus inferencias en el análisis visual de los datos graficados. Cada estrategia 
de evaluación tiene sus ventajas y sus inconvenientes, por dicho motivo, se recomienda que ambas 
complementen a la evaluación clínica. 


12.4.1. Análisis visual de los resultados 


El ANÁLISIS VISUAL DE LA INFORMACIÓN GRÁFICA ha sido y sigue siendo el método dominante para 
evaluar los efectos del tratamiento en la investigación con DCU (Ferron y Jones, 2006; Horner, Swami- 
nathan, Sugai y Stokowski, 2012; Kratochwill et al., 2010). La meta de los métodos de análisis visual, es 
proporcionar juicios fiables acerca de la consistencia de los efectos del tratamiento mediante el examen 
ocular de los datos graficados. En la documentación técnica facilitada por diversos autores y editores 
(ver Kazdin, 2011) se informa de varios aspectos que deben considerar los analistas para evaluar el im- 
pacto mediante la inspección ocular, destacando los siguientes: 


1. Estabilidad de la línea base. De acuerdo con Sidman (1960) y Kazdin (2011), la línea base cum- 
ple una doble función. Por un lado, sirve para describir la conducta en ausencia de tratamiento 
y, por otro lado, sirve para predecir el desempeño. La función predictiva resulta clave para eva- 
luar con precisión los efectos de la intervención, y de ahí la necesidad de contar con líneas base 
relativamente estables y preferentemente libres de tendencias, o en su defecto, con tendencias 
en dirección opuesta a la presumible mejora ocasionada por el tratamiento. Cuando la variabili- 
dad de la línea base sea excesiva, se recomienda proseguir con el registro de observaciones hasta 
conseguir la estabilidad de la misma, o hasta lograr que emerja algún patrón de conducta. 


2. Variabilidad intrafases e interfases. La excesiva fluctuación de los datos durante la línea base u 
otras fases del diseño complica la evaluación de la efectividad del tratamiento. Cuando la varia- 
bilidad de la línea base sea excesiva, la magnitud del cambio atribuido al impacto deberá ser con- 
tundente para poderse detectar. En estos casos, además de tener que incrementar la longitud de la 
fase y la fiabilidad de las medidas, es fundamental controlar las variables extrañas, así como distin- 
guir la variabilidad de los datos de otras características de los mismos, tales como las tendencias 
y los ciclos. De otro modo, el analista deberá desconfiar de las inferencias efectuadas mediante 
la inspección visual, pues el solapamiento entre las puntuaciones de las fases adyacentes puede 
llegar a ser considerable. A efectos de valorar la variabilidad de los valores registrados, los gráficos 
de barras de rangos y de líneas de rangos pueden resultar de utilidad. 


El GRÁFICO DE BARRAS DE RANGOS se realiza conectando tres puntos a través de una línea vertical, 
la mediana y los valores extremos del rango, dentro de cada fase del diseño, ignorando los puntos 
restantes. El cambio o variación de la mediana del centro de la vertical aporta una idea relativa de 
la variabilidad intrafase de los datos. El GRÁFICO DE LÍNEAS DE RANGOS se construye trazando dos 
líneas paralelas al eje del tiempo, tomando como puntos de referencia los niveles más alto y más 
bajo dentro de cada fase. En la figura 12.6 (tomada con modificaciones de Franklin et al., 1997), 
aparece representada la variabilidad de un diseño A— B— A mediante los dos métodos descritos. 
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Figura 12.6. — Gráfico para evaluar la variabilidad dentro de cada fase. 


3. Solapamiento entre fases adyacentes. Este fenómeno tiene lugar cuando el patrón particular de da- 
tos que se observa en una determinada fase se aproxima al patrón obtenido en una fase anterior. 
Es evidente que un mayor efecto de la intervención implica un menor grado de solapamiento y 
viceversa. Una forma rápida y sencilla de comprobar si ocurre el solapamiento entre los datos de 
dos fases adyacentes, consiste en hacer uso del gráfico de líneas anterior. Cuando el objetivo del 
estudio sea extinguir o reducir una conducta no deseable, basta con tomar como puntos de refe- 
rencia el nivel más bajo de la primera fase (p. ej., línea base) y el más alto de la segunda (fase de 
tratamiento); al contrario, cuando la meta sea potenciar una conducta deseable. En la figura 12.7 
se muestra el procedimiento descrito. 


Respuesta 


> P 


sesiones 


Figura 12.7. — Gráfico para evaluar el solapamiento entre fases. 


4. Cambios de tendencia intrafase e interfase. La inclinación o tendencia se refiere a la propensión de 
los datos de exhibir incrementos o decrementos sistemáticos a lo largo del tiempo. Los cambios 
de tendencia intrafase afectan directamente a la interpretación de los datos, en especial cuando, 
además de acontecer en la fase de tratamiento, se orientan hacia los niveles de la línea base (Ar- 
nau, 1995b). Por consiguiente, el analista deberá extremar su control si quiere garantizar la validez 
interna de la investigación. A su vez, los cambios de tendencia interfases constituyen el principal 


OEdiciones Pirámide 


Diseños de caso único 455 


criterio para decidir si la intervención produce efectos confiables. La inmediatez y constancia de 
los cambios facilitan las inferencias acerca del efecto de la intervención. En la figura 12.8 se mues- 
tran diferentes patrones de cambio de tendencia entre fases. 


Figura 12.8. — Patrones de cambio interfases. 


Desafortunadamente, la mayoría de las veces los patrones de cambio de tendencia no suelen ser 
tan fáciles de interpretar como los recogidos en la figura 12.8. No obstante, los analistas que basan 
sus inferencias en la exploración visual de los datos disponen de diversos métodos para la de- 
terminación y representación de las tendencias. De entre los diversos procedimientos existentes, 
cabe destacar el de la regresión mínimo cuadrática, el de la división por el medio (split-middle 
method), el de la línea de tendencia resistente (resistant trend line fitting) y el de las medianas 
con distintos recorridos (running medians). Para más detalles acerca de estas técnicas el lector 
interesado puede consultar Ato y Vallejo (2007). 


5. Cambios en el nivel de la respuesta entre fases adyacentes. Un aspecto crucial a la hora de determi- 
nar la efectividad del impacto mediante el análisis visual radica en identificar cambios consisten- 
tes entre las respuestas de fases diferentes, los cuales pueden ser abordados desde un doble punto 
de vista. Por un lado, inspeccionando los cambios de nivel propiamente dichos y, por otro lado, 
examinando los cambios en la media a través de fases sucesivas, o de cualquier otro valor de lo- 
calización central. Los cambios de nivel se refieren a la variación o discontinuidad en la serie de 
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puntuaciones de una fase a la siguiente como consecuencia de la presentación o retirada de la in- 
tervención, mientras que los cambios en el puntaje de la media hacen referencia a las variaciones 
acaecidas en la tasa promedio de respuesta. Tanto las variaciones en el nivel como en la media 
a través de las distintas fases del diseño, son usados por el analista de datos para decidir si la in- 
tervención produjo cambios consistentes y confiables. En la figura 12.9 se muestran los cambios 
de nivel y los cambios en la media, así como la consistencia del patrón de respuestas entre fases 
similares. 
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Figura 12.9. — Gráfico para evaluar los cambios de nivel y la consistencia de los patrones de respuesta entre 
fases similares. 


En presencia de datos no estacionarios (cuando en las diferentes fases estén presentes tendencias 
O patrones de variación cíclica), ambos cambios pueden ser independientes; de ahí que pueda 
suceder que no ocurra cambio de nivel alguno y que las medias de dos fases adyacentes difieran 
sustancialmente entre sí y viceversa; obviamente, también puede ocurrir que un cambio en el ni- 
vel vaya seguido de un cambio en las medias. Resaltar, por último, que los cambios de nivel y los 
cambios en el puntaje de la media serán coincidentes cuando las series estén libres de dependen- 
cia serial (Kratochwill et al., 2010). 


6. Evaluación del patrón global de los datos. Como se ha puesto de relieve en el apartado anterior, en 
los DCU el examen de la representación gráfica de los datos puede abordarse a lo largo de varias 
dimensiones. No obstante, los parámetros aludidos con mayor insistencia a la hora de identificar 
patrones de cambio confiables, tanto en investigación experimental como clínica, son los refe- 
ridos a los cambios en el nivel de la serie entre fases, a la presencia o ausencia de tendencias, a 
los cambios de tendencia o alos cambios de nivel y de tendencia. A su vez, conviene resaltar que 
los dos tipos de cambios pueden ser instantáneos o demorados y permanentes o temporales. Por 
tanto, teniendo en cuenta que una intervención puede ocasionar patrones de cambio de índole 
muy diverso, es muy importante que el analista escudriñe minuciosamente sus datos. En la figura 
12.10, tomada de Glass, Willson y Gottman (1975), se incluyen algunos de los posibles patrones de 
cambio que pueden aparecer cuando se utilizan los DCU. 


Al margen de lo dicho, otro aspecto que tiene gran relieve a la hora de evaluar el patrón global de los 
datos por medio de gráficos es la consistencia en la replicación. Por ejemplo, cuando se utilizan diseños 
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de reversión o de línea base múltiple es fundamental comprobar la equivalencia de los resultados entre 
las fases similares del diseño (fases de control y fases de tratamiento) —véase figura 12.9—. Siempre que 
se pueda descartar que el comportamiento entre fases similares esté controlado por factores ajenos 
al tratamiento que se manifiestan de forma sistemática, regular y periódica a lo largo del tiempo, se 
incrementa sustancialmente la confianza del investigador en las inferencias causales realizadas. 
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Figura 12.10. — Patrones de cambio de nivel más comunes en los DCU. 


En resumen, cuando los cambios en el nivel y/o pendiente discurren en la dirección deseada, y cuan- 
do los cambios son inmediatos, fáciles de discernir y sostenidos en el tiempo, se concluye que los cam- 
bios en el comportamiento a través de las fases se deben al tratamiento aplicado y son indicativos de 
una mejora (Busse, Kratochwill y Elliott, 1995). Antes de concluir, queremos poner de relieve que varios 
investigadores han encontrado que los analistas visuales bien entrenados tienden a tomar decisiones 
acertadas, en relación con la eficacia de un tratamiento (Kahn et al., 2010). Por el contrario, otros infor- 
man que los analistas visuales cometen tasas de error Tipo I que exceden el nivel permitido (Greenwood 
y Matyas, 1990; Matyas y Greenwood, 1990), sobre todo cuando la correlación serial está presente en la 
serie. 


12.4.2. Análisis estadístico de los diseños de caso único 


Cuando la variabilidad dentro de las fases es pequeña, un mero análisis visual de los datos puede 
resultar suficiente para detectar el efecto del tratamiento y para considerarlo clínicamente significativo. 
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Sin embargo, la ambigúedad de las inferencias visuales irá en aumento a medida que se incremente la 
variabilidad dentro de las fases, los tamaños del efecto decrezcan y los tratamientos evaluados sean más 
novedosos. En estos casos resulta muy útil complementar los análisis visuales con los estadísticos. 

Durante la década de los setenta, diversos investigadores (Chassan, 1967; Gentile, Roden y Klein, 
1972; Shine y Bower, 1971) sugirieron que los datos obtenidos con DCU se podían analizar modificando 
la prueba £ de Student y el ANOVA de medidas repetidas. Sin embargo, Hartmann (1974) y otros autores 
(Glass et al., 1975; Jones, Vaught y Weinrott, 1977; Kratochwill et al., 1974; Thoresen y Elashoff, 1974), 
cuestionaron la adecuación de dichas propuestas debido a la falta de independencia de los errores del 
modelo. Por lo tanto, en lo que resta de este capítulo nos centraremos en otras técnicas alternativas, 
tanto paramétricas como no paramétricas, cuya eficacia para analizar los DCU ha sido puesta de relieve 
en numerosas ocasiones. Dentro de las pruebas estadísticas paramétricas, consideraremos el análisis 
de serie de temporales cortas y el análisis multinivel, mientras que dentro de las pruebas estadísticas no 
paramétricas abordaremos brevemente las pruebas de aleatorización. 


12.4.3. Modelos de regresión en el análisis de series de tiempo 


Un examen de las publicaciones metodológicas en la investigación conductual pone de relieve la 
falta de consenso acerca de la mejor técnica de análisis paramétrico de los DCU. Por un lado están los 
que defienden la vigencia de enfoques basados en alguna versión del modelo lineal general (p. ej., el 
enfoque de la regresión) y, por otro, los que defienden enfoques basados en modelos no lineales (p. ej., 
el enfoque autorregresivo). A pesar de que el modelo de regresión clásico juega un importante papel a 
la hora de estimar y probar cambios entre las medias de diferentes fases del diseño, este enfoque sólo 
es válido si los errores asociados con las observaciones registradas con anterioridad y con posterioridad 
al evento de interés varían en torno a las medias de las respectivas fases normal e independientemente 
y con variancia constante (Box y Tiao, 1975). Cuando se viola el supuesto de independencia, se tiende a 
infravalorar las estimaciones de los errores estándar y a incrementar las tasas de error Tipo 1. Es decir, se 
es propenso a indicar que existe un efecto del tratamiento, cuando puede que no se haya producido. 

Si las observaciones del modelo de regresión son independientes, el estimador de mínimos cua- 
drados ordinarios (OLS) es el más apropiado, pues tiene la varianza más pequeña entre todos los es- 
timadores posibles. Sin embargo, cuando se registran datos a lo largo del tiempo resulta común que 
las observaciones no sean independientes. En este caso, los supuestos del modelo de regresión clásico 
son violados y el estimador OL£S ya no es el mejor estimador de los coeficientes de regresión. El estima- 
dor de mínimos cuadrados generalizados ('Generalized Least Squares”, GLS), que minimiza los errores 
ponderándolos por la inversa de la matriz de covarianza de las observaciones, resulta más adecuado 
(Goldberger, 1962). Si la longitud de la serie temporal es larga, podemos modelar la dependencia entre 
los errores mediante procesos autorregresivos (AR), procesos de promedio móvil (MA), o bien median- 
te una combinación de ambos procesos (Box y Jenkins, 1970; Glass et al., 1975; Velicer y Molenaar, 2013) 
y obtener las estimaciones GL£S. En este contexto identificar el modelo incluye determinar el orden del 
proceso autorregresivo o de media móvil. Este cometido puede resultar más complejo que determinar 
la forma funcional del modelo, incluso si se dispone de datos suficientes (Velicer y Molenaar, 2013). 

Para solventar el problema que supone las series temporales cortas propias de los DCU (p. ej., 
N < 20), se sugieren los pasos siguientes. En primer lugar, incorporar los componentes de variación 
sistemática relevantes dentro del modelo, incluyendo el tratamiento, y efectuar el análisis utilizando el 
criterio OLS, o sea, modelar las tendencias seculares, el impacto y las posibles interacciones de interés. 
En segundo lugar, verificar si para explicar los cambios observados en la conducta la relación funcional 
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entre las variables ha sido bien establecida mediante el modelo especificado. Para realizar esta función 
diagnóstica, en especial la referida a la posible presencia de dependencia serial, conviene combinar al- 
guna de las pruebas estadísticas disponibles (p. ej., la prueba de Durbin-Watson) con el examen visual 
de los residuales (p. ej., la función de autocorrelación). Y por último, si la correlación está presente se 
recomienda asumir que la dependencia de los errores sigue un proceso autorregresivo de primer orden 
[AR(1)] o un proceso de media móvil de primer orden [MA(1)] y utilizar el criterio de los G£S. 

Supongamos que las respuestas emitidas a lo largo del tiempo por una simple unidad de análisis 
sean adecuadamente explicadas mediante la relación lineal de k variables predictoras, más un término 
de error que recoja el efecto conjunto de otras variables no directamente implicadas en el modelo y cuyo 
efecto no resulte relevante. Formalmente, 


Y, = Po+ P1X11+ PB2X21 +++ Pr Xx0 + es (12.1) 


donde Y, es la puntuación dada a la respuesta medida en el tiempo t, fp es la intercepción del pro- 
ceso, fB1,--- Py son los coeficientes de regresión parcial del modelo, X; ;, -** , Xp son los valores de las 
variables X en el tiempo t y e; es el error del proceso en el tiempo t. 

Para proceder a la estimación de los parámetros de la ecuación anterior, hemos de establecer algu- 
nos supuestos sobre el modo en que se han obtenido las observaciones. Estos supuestos son decisivos 
en el proceso inferencial y, en lo referente a los errores del modelo, se asume que éstos se distribuyen 
normal e independientemente con media cero y varianza constante. En la práctica, alguna de las hipó- 
tesis nulas referidas a este conjunto de supuestos puede ser rechazada, bien sea porque la serie resulte 
no estacionaria, o bien porque la serie presente dependencia serial. Aunque el interés de nuestro trabajo 
se centra en cómo analizar los datos de los DCU cuando el proceso de error está autocorrelacionado, la 
correcta caracterización de este proceso requiere que la serie temporal, además de tener un número de 
observaciones considerable, también sea estacionaria. 

En la práctica cabe esperar que la serie muestre alguna tendencia o inclinación a lo largo del tiempo. 
Esto plantea dos problemas al investigador: por un lado, determinar si está presente en la serie algu- 
na forma de variación (secular o estocástica) y, por otro lado, proceder a su modelación o extracción. 
Una mera inspección visual de los datos suele ser suficiente para averiguar si el proceso muestra una 
tendencia. No obstante, esta operación se puede complementar con la división de la serie temporal en 
dos segmentos de igual longitud, los cuales deben tener el mismo nivel, en caso contrario, la serie se 
desplaza y, por ende, no se puede mantener que la media sea constante para todo £. En presencia de 
tendencias de carácter secular (inclinación sistemática a lo largo del tiempo), antes que diferenciar la 
serie para remover las tendencias, se recomienda incorporarlas en la ecuación de regresión como va- 
riables explicativas adicionales. La incorporación de las tendencias dentro de la ecuación, además de 
subsanar posibles errores de especificación del modelo, permite que sus efectos sean medidos, pro- 
bados e interpretados. La omisión de tendencias seculares relevantes a la hora de describir los datos, 
determina la presencia de dependencia serial en los residuales, o al menos, contribuye a incrementarla 
de forma sustancial. A continuación se describe como modelar tendencias en los DCU. Para ello nos 
vamos a centrar en las cuatro situaciones que aparecen recogidas en la figura 12.11. 

Los datos esquematizados en la figura 12.11(a) representan una situación en la cual las tendencias 
están ausentes, pero existe una discontinuidad entre los puntos de la serie como consecuencia de la 
intervención. En ausencia de tendencia, la estructura del diseño A— B se puede modelar mediante la 
ecuación de regresión que sigue: 
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Y, = Bo + P1X;+ es (12.2) 


donde Y, representa el valor de la variable dependiente en el tiempo t, 6, es una constante que indica 
el nivel promedio de la serie temporal, X; es una variable ficticia que toma el valor *0” con anterioridad 
a la presentación del tratamiento y '1* después, f] es una constante que indica si se ha producido algún 
cambio en el nivel de la serie como consecuencia de la introducción de la intervención y e, son los 
errores o perturbaciones aleatorias del modelo que asumimos normales, con varianza constante a lo 
largo de todos los puntos de la serie temporal y mutuamente independientes. 


Figura 12.11. — Muestra de posibles resultados para el DCU A- B. 


Si se cumplen los supuestos relativos a la distribución de probabilidad de los términos de error, se 
está en condiciones de proceder a evaluar la significación de los coeficientes del modelo. La vía más 
sencilla de proceder consiste en calcular el estadístico 


tf; = EE AE (12.3) 


yz ¿voiB) 


donde é; es el error residual (diferencia entre la puntuación observada y la estimada), v son los grados 
de libertad asociados con la varianza residual (usualmente N-k-1) y cÍJ es el j-ésimo elemento de 
la diagonal de la matriz XL A su vez, (6 ¡) se distribuye como una £ de Student con v grados de 
libertad. De estar interesados no sólo en la estimación puntual, sino también en evaluar la exactitud 
con que la estimación OLS ha sido realizada, se puede hacer uso de la estimación por intervalos de 
confianza que sigue: 
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PABj— tana 1SEBIS BjS Bit tank 1 1SE(ÓDI) (12.4) 


donde SE(B$5) s [EN wei Bj] e y Bi es el estimador OLS del parámetro 6;. 

Para analizar los datos que caracterizan la situación especificada en la figura 12.11(b), se requiere 
modelar la tendencia con la finalidad de que los posibles cambios operados a raíz de la administra- 
ción del tratamiento no se vean enmascarados por el componente de tendencia. Dicho de otra manera, 
en presencia de una tendencia se necesita verificar si la serie se desplaza en el punto de intervención 
independientemente de la evolución natural de la tendencia. En definitiva, la cuestión a resolver es la 
siguiente: ¿La aplicación de un tratamiento produce algún cambio en las respuestas de los sujetos al 
margen de la curva evolutiva que siguen los datos? Para dar cuenta de esta cuestión se puede llevar a 
cabo un análisis de regresión en el cual, además de modelar la intervención, también se incorpore la 
tendencia como una variable explicativa adicional. Para realizar tal cometido se puede hacer uso de 
una variable subsidiaria (proxy), de forma tal que el tiempo sea medido puntuando con 1 la primera 
observación, con 2 la segunda y, así hasta la última puntuación a la que se asignará el valor N, siendo 
N = na+ nb. Si el supuesto de linealidad entre las variables independientes y la dependiente no se sa- 
tisface, es decir, si el ajuste a una tendencia lineal no fuese suficiente, se eleva la variable 'proxy' tiempo 
al cuadrado con el fin de modelar la tendencia cuadrática a la que probablemente se ajusten mejor los 
datos. Polinomios de orden más elevado raramente son requeridos. 

El cambio de nivel en presencia de tendencia puede ser estimado mediante la ecuación de regresión 
múltiple siguiente: 


Y, = Bo + P1T, + P2X; + e, (12.5) 


o, bien ajustando el modelo cuadrático: 


Y, = Bo + P1T++P2T? + PoX,+ es (12.6) 


donde Y, representa el valor de la variable dependiente en el tiempo t, By es una constante que indica 
el valor que toma la respuesta en el tiempo 0, $1 es una constante que indica si acontece una tasa de 
cambio constante a lo largo del período de tiempo que duran las observaciones, 62 es una constante 
que indica si la tasa de cambio describe una tendencia cuadrática, $3 es una constante que indica si se 
ha producido un cambio de nivel como consecuencia de la introducción del impacto y e, son los errores 
aleatorios con los supuestos especificados anteriormente para la media, la varianza y la covarianza. 
Continuando con el modelado de la tendencia, en la figura 12.11 (c) existe cambio de tendencia entre 
las dos fases de la serie y ausencia de cambio de nivel. En principio, cabe suponer que la mayor o menor 
inflexión en el componente de tendencia guarde relación con el tamaño del efecto de la intervención. 
El cambio de dirección que experimenta la tendencia a raíz de la presentación del impacto se puede 
manejar incluyendo dos covariantes temporales distintas en el análisis, una para la fase de línea base y 
otra para la fase de tratamiento. La primera covariante recoge los valores asociados con la variable de 
recuento de las observaciones; de esta forma, tanto a los datos registrados con anterioridad a la intro- 
ducción del programa, como a los registrados con posterioridad al mismo se les asigna el valor temporal 
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correspondiente al periodo de observación. La segunda covariante también recoge los valores de la va- 
riable proxy tiempo, pero, a diferencia de lo dicho para la primera covariante, los n¿ registros previos a 
la intervención se codifican como 0, mientras que los valores correspondientes al cambio de pendiente 
se codifican como T; — ng. La modelación del componente de interacción no está exenta de problemas 
(Huitema y McKean, 2000, ofrecen un análisis detallado de esta cuestión). 

Cuando a raíz de la administración del programa la tendencia cambie de orientación, una ecuación 
que incluya las dos covariantes citadas reproducirá los datos de una manera más exacta que otra ecua- 
ción que tan sólo incorpore el tiempo como variable explicativa. De este modo, la ecuación de regresión 
que resulta más apropiada para detectar el cambio de tendencia queda convenientemente expresada 
como: 


Y, = Bo + P1T, + P2Z,+ e, (12.7) 


donde Z; es una variable 'proxy” que toma el valor 0 para las n¿ primeras observaciones, el valor 1 para la 
primera observación posterior a la intervención, el valor 2 para la segunda observación y el valor N—n, 
para la última observación. El resto de los términos que aparecen en la ecuación ya han sido definidos 
con anterioridad. 

Por último, una situación más general dentro del DCU de un solo componente se refiere a la posi- 
bilidad de abordar simultáneamente tanto el cambio de nivel como el cambio de tendencia. La figura 
12.11(d) esquematiza adecuadamente lo dicho, en ella se aprecia un cambio de nivel, la presencia de 
tendencia y un cambio en la orientación de ésta a raíz de la administración del tratamiento. Por este 
motivo, en este diseño debemos verificar no sólo si la presentación del tratamiento produce una dis- 
continuidad en el punto de intervención de la serie temporal, sino también si como consecuencia de la 
introducción del impacto se produce interacción tratamiento x tendencia, o si se prefiere algún cambio 
en el sentido u orientación de las tendencias a través de las fases. Para ello es necesario incluir tres varia- 
bles explicativas en el modelo, exceptuando la constante. La primera variable se refiere a la tendencia, 
la segunda se refiere al tratamiento experimental y la tercera variable recoge los cambios de tendencia 
posteriores a la intervención o efecto de la interacción entre el tratamiento y la tendencia. Al igual que 
en caso anterior, las primeras n¿ observaciones codifican con el valor 0, la primera observación pos- 
terior a la intervención con el valor 1 y, así sucesivamente, hasta la última que se codifica con el valor 
N— na. Bajo esta situación, la ecuación modelo que resulta más adecuada para detectar los cambios 
aludidos puede expresarse como sigue: 


Y, = Po + PIT; + P2X++ P3X+(T;— Na) + es (12.8) 


Se excusa decir que nada impide que el modelo de la regresión aplicado a series temporales pueda 
ser extendido para analizar los datos obtenidos mediante diseños más complejos. Por ejemplo, puede 
ocurrir que el investigador esté interesado en el análisis de múltiples cambios de fase, bien sean éstos 
debidos a la administración, supresión, reinstauración y, así sucesivamente, del tratamiento o bien sean 
debidos a cambios que se dan en la variable de respuesta cuando el tratamiento se hace depender de 
un criterio establecido de antemano. También es factible acomodar dos o más niveles de un mismo 
tratamiento, dos o más tratamientos distintos e inclusive tratamientos combinados, tal y como sucede 
con los diseños de caso único multinivel, de tratamiento múltiple e interactivos descritos anteriormente. 
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A. Pruebas usuales para estimar la dependencia serial 


Una vez seleccionada la ecuación que ofrece una mejor explicación de los cambios observados en 
la conducta, procede pasar a comprobar si los residuales del modelo especificado son o no indepen- 
dientes. Aunque en la actualidad se hallan disponibles diversas medidas de la dependencia serial (véase 
Bono, 2001). Las más usadas son el coeficiente de correlación p y el estadístico DW de Durbin-Watson. 
Para retardos de orden uno el coeficiente de correlación estimado, (1, se obtiene como sigue: 


Eprztrér 
2Li=1% 
El estadístico DW guarda una estrecha relación con el coeficiente de correlación 61, ya que 
DW =2(1- 61) (12.10) 


La ecuación 12.10 indica que el estadístico DW varía entre 0 y 4, de manera que cuando 6, se aproxi- 
ma a0 el valor del estadístico DW se aproxima a 2, cuando (1 se aproxima a — 1 el valor del estadístico se 
aproxima a 4 y cuando f1 se aproxima a 1 el valor del estadístico se aproxima a 0. Para un determinado 
nivel de significación, el estadístico DW está comprendido dentro de los límites de otros dos estadísti- 
cos, denominados límite inferior y superior (en adelante DW; y DWs). Kmenta (1971) resume las reglas 
de decisión que nos permiten probar la hipótesis nula (Hp) de ausencia de dependencia serial frente a 
la alternativa (H,) de correlación serial positiva o negativa como sigue: 


— si DW < DW; ó 4-— DW; < DW, rechazamos Hp y aceptamos H.; 
— si DWs < DW <4- DW ó DWs < DW < 4-— DW], aceptamos Hp y rechazamos H;, y 
— si DW; < DW < DWs ó 4- DWs < DW < 4-— DW,, la decisión cae en zona incierta. 


El diagrama de la figura 12.12 permite también valorar gráficamente la decisión. 


Hechaza]  Zonade Acepta H, Zonade  |Becaza 
EL incertidumbre (No autocorrelación) | incertidumbre 


Figura 12.12. — Regiones de significación de la prueba DW de Durbin-Watson. 


Los valores de DW; y DWs para probar la Ay de que no existe autocorrelación serial aparecen recogidos 
en unas tablas elaboradas por Savin y White (1977). Una selección de valores se reproducen en las tablas 
T (para a =.05) y] (para a = .01) del Anexo de tablas al final del texto, para un rango usual del número de 
casos N (o del número de registros temporales, de 6 a 100) y del número de parámetros q, que incluyen 
predictores y constante (de 2 a 10). 
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B. Análisis de regresión de series de tiempo de un diseño A-B 


Para clarificar lo dicho supongamos que se hubiera utilizado un diseño A— B para mejorar el com- 
portamiento de un paciente depresivo. Mediante un programa de economía de fichas se recompensó 
al paciente siempre que efectúo una serie de tareas consideradas de interés (p. ej. mantener la higiene 
personal). Durante diez sesiones de observación, de las veinte que duró la investigación, el paciente es- 
tuvo en contacto con las fichas, pero los premios (la ganancia de fichas) no le fueron administrados de 
manera contingente; sin embargo, durante las diez siguientes los premios se le otorgaron contingente- 
mente. Los datos hipotéticos en porcentajes aparecen recogidos en el cuadro 12.2. 


CUADRO 12.2 
Datos hipotéticos referidos a la conducta de un paciente depresivo 


Sesión 


A 
a 


S1 
S2 
S3 
S4 
S5 
S6 
S7 
S8 
S9 


VO JO 0d >a 0u DA 


A > E E NS E E 


Si ajustamos el modelo de la ecuación 12.5 a los datos del cuadro 12.2 por OLS, o sea, mediante 
regresión múltiple de Y, (columna 2) con respecto a T; (columna 3) y X; (columna 4), se obtiene: 


Y, = 38(1.70) + 2(0.25) T,—9(2.87) X,[R? = 0.88, DW =1.11] 


donde Y, se refiere al porcentaje observado de conductas depresivas, T, es una variable de tendencia de- 
terminista que recoge tan sólo el paso del tiempo y X; es una variable ficticia (dummy) que informa de 
las sesiones asociadas con las fases de control y tratamiento. A su vez, los valores entre paréntesis indi- 
can los errores estándar de cada uno de los parámetros estimados, R? expresa la proporción de varianza 
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de la variable de respuesta explicada por el modelo y DW denota el valor del estadístico Durbin-Watson 
usado para contrastar la hipótesis nula de ausencia de correlación serial de primer orden. 

Consultando las tablas DW recomendadas observamos que para a = 0.05 y q = 3 (porque son dos 
predictores, T; y X;, más la constante) y N = 20 casos o registros temporales, las cotas inferior y superior 
valen, respectivamente, DW = 1.100 y DWs = 1.537. Puesto que 1.100 < 1.11 < 1.537, de acuerdo con las 
reglas de decisión anteriormente indicadas y del diagrama de la figura 12.12, entra dentro de la zona de 
incertidumbre y por tanto no podemos concluir que los errores sean mutuamente independientes. En el 
caso de interpretar los resultados referidos a la tendencia y al impacto, éstos resultarían sobrevalorados. 

Ante una situación como la descrita procede asumir que la dependencia de los errores sigue un 
proceso AR(1) y utilizar el criterio de los G£S. Existen varios procedimientos para la estimación de la 
autocorrelación como parte del análisis de regresión, incluyendo los métodos de la máxima verosimi- 
litud, Cochran-Orcutt, Prais-Winsten, Hildreth-Lu, Durbin y el enfoque bayesiano. Los tres primeros se 
encuentran en el procedimiento SERIES TEMPORALES, módulo AUTO-REGRESION, del SPSS. 

Si ajustamos de nuevo el modelo de la ecuación 12.5 alos datos del cuadro 12.2 por G£S, empleando 
el método de Cochran-Orcutt, se obtiene la ecuación predictiva siguiente: 


Y, = 37.76(3.34) + 1.95(0.36) T; — 7.59(3.43) X¿[R? = 0.71, DW = 1.80] 


donde ahora 1.100 < 1.80 < (4— 1.437), y por tanto entra en la zona de aceptación de Hp. En conse- 
cuencia, se puede comprobar que bajo esta nueva situación los errores transformados son mutuamente 
independientes [1.110 < 1.80 < (4— 1.537) y nada impide ahora interpretar los resultados. 

De acuerdo con la prueba |£|, tanto el estimador del coeficiente $1 como el estimador del coeficien- 
te f> resultaron significativamente diferentes de cero a los niveles del 1 y 5% respectivamente, pues 
t(17) = 2.90 < 5.42(1.95/0.36) al 1% y £(17) = 2.11 < -2.21(-7.59/3.43) al 5%. Concretando aún más, 
podemos decir que el valor estimado de 6; indica que el porcentaje de comportamientos depresivos 
sufre un incremento paulatino a lo largo de las diferentes sesiones, mientras que el valor estimado de 
f2 indica una desaceleración en porcentaje de comportamientos depresivos como consecuencia de la 
introducción del tratamiento. No obstante, repárese que este descenso fue relativo, ya que en términos 
absolutos los comportamientos depresivos se fueron incrementando con el paso del tiempo. 


12.4.4. Análisis multinivel de los diseños de caso único 


El análisis multinivel es un enfoque mucho más flexible que el método de la regresión estándar para 
modelar complejidades tales como la dependencia serial, el efecto de variables explicativas a distintos 
niveles (p. ej., edad, sexo, raza) y la heterogeneidad entre los sujetos y dentro de los mismos (Vallejo, Fer- 
nández, Livacic-Rojas y Cuesta, 2015). Este enfoque permite estimar el efecto promedio de tratamiento 
a través de los sujetos, además del efecto específico (Shadish y Rindskopf, 2007; Van den Noortgate y 
Onghena, 2008). Realizando un análisis multinivel se puede responder a cuestiones de investigación 
difícilmente abordables usando el enfoque de regresión, tales como: 


1. ¿Cuál es la magnitud del efecto medio del tratamiento a través de los sujetos? 
2. ¿Cuál es la magnitud y la dirección del efecto de la intervención en sujetos específicos? 
3. ¿Cuánto varía el efecto del tratamiento dentro de los sujetos y a través de los mismos? y 


4. ¿Modera una variable explicativa el efecto del tratamiento? 
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Recientemente, se han propuesto diversas extensiones del análisis multinivel con el fin de modelar los 
datos basados en el recuento de eventos (Shadish, Kyse y Ridnskopf, 2013), las tendencias no lineales 
(Hembry et al., 2015) y la autocorrelación (Baek y Ferron, 2013). Actualmente, el análisis multinivel tam- 
bién se usa para sintetizar la literatura de una manera objetiva, con el fin de contribuir a la investigación 
basada en la evidencia y para mejorar la práctica (Shadish y Rindskopf, 2007). 


A. Análisis multinivel de un diseño A— B-— A-— B de generalización 


Para ilustrar el modelado multinivel de un diseño replicado, utilizamos el análisis de los datos de 
una investigación de Lambert, Cartledge, Heward y Lo (2006). En una clase de matemáticas de primaria, 
estos autores evaluaron los posibles efectos de las "tarjetas de respuesta"para reducir la conducta per- 
turbadora e incrementar el rendimiento académico. El estudio empleó un diseño de reversión, que se 
inició con una primera fase de control (41) seguida por una primera fase de tratamiento (B,), continuó 
con una segunda fase de control (42) y concluyó con una segunda fase de tratamiento (B>). En el cuadro 
12.3 se recogen los datos de los 9 sujetos que participaron en el estudio con 10 observaciones en la fase 
A] (na, = 10), 6 en la fase Bl (ng, = 6), 8 en la fase A2 (NA, = 8) y 11 en la fase Ba (ng, = 11). 

Inicialmente, nos vamos a centrar en estimar el efecto promedio del tratamiento, así como en de- 
terminar la variabilidad que manifiesta dicho efecto a través de los participantes. Bajo este escenario, 
a las mediciones llevadas a cabo durante las fases de línea base (41 y 42), se les asigna el valor cero 
(Fase; = 0) mientras que a las mediciones registradas durante las fases de tratamiento (B¡ y Ba), se les 
asigna el valor uno (Fasej¡;= 1). 

Para detectar los cambios aludidos bajo el escenario descrito, comenzaremos formulando un mode- 
lo a nivel 1 (mediciones repetidas o periodos) 


Yir = boi + b1¡Fase;: + ej: (12.10 


donde Y; denota la respuesta emitida por del ¿-ésimo participante en el t—ésimo periodo, bp; es nivel 
promedio de la serie en línea base (41 o 42) para el ¡—ésimo participante, b,; es su correspondiente 
cambio de nivel en la fase de tratamiento (B o B») y e;, es el usual término de error (que mide la variabi- 
lidad que existe entre la respuesta dada por ¿¡—ésimo participante en el t—ésimo periodo y el promedio 
de respuestas emitidas por dicho participante a lo largo de la serie). La ecuación a nivel 2 (participante) 
modela la variabilidad existente entre los participantes en los parámetros de la ecuación 12.11: 


Doi 
bx; 


Yoo + Up;¡ (12.12) 


Y10 + Uy; 


donde yoo denota el nivel medio en línea base y yo1 indica el efecto promedio del tratamiento. A su vez, 
uy; denota el efecto único del ¿-ésimo participante (la desviación del nivel medio obtenido con cada 
participante respecto del nivel medio general) y u¡; denota el efecto único del ¿-ésimo participante (la 
desviación del cambio de nivel dentro de cada participante del cambio de nivel medio general). El nivel 
estimado medio en línea base, el efecto estimado medio del tratamiento (cambio de nivel), la variación 
entre los participantes y la covarianza entre estimaciones, así como la estimación de la varianza dentro 
de los participantes se muestra en el cuadro 12.4 y se etiquetan como Modelo 1 (M). 
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CUADRO 12.3 
Datos de Lambert, Cartledge, Heward y Lo (2006) 
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ID = Participante; (-) = Observación perdida 


A continuación, el interés se centra en examinar los cambios que ocurren en la variable de respuesta 
al introducir nuevas fases en el diseño. Una inspección visual de los datos representados en la figura 
12.13 apunta a la existencia de tres cambios de nivel. Con el fin de estimar dichos cambios, Shadish et al. 
(2013) sugieren extender la ecuación 12.11 incluyendo tres variables ficticias que indiquen los distintos 
cambios de nivel entre fases. Por conveniencia las variables ficticias se etiquetan por A1By;r, B¡ A2;+ y 
A2B»;,. La primera variable ficticia se define puntuando con 0 los primeros na registros y con 1 los 
N-—naA1 registros restantes, la segunda se define puntuando con 0 los (n 4] + Ng]) registros previos a 
la retirada del tratamiento y con 1 los N— (na, + Np,) registros restantes, y la tercera puntuando con 0 
los (N4] + Ng] + NA2) registros previos a la reintroducción del tratamiento y con 1 los N— (na4] + Np] + 
N 42) restantes. Al optar por esta forma de codificación, los valores esperados de las fases Aj, B¡, A» y 
B, son, respectivamente, Boi, Boi + B1i, Boi + Pri + Pos y Poi + Pr: + Bai + P3;, donde fo; indica el nivel 
correspondiente a la primera línea base, 61; el efecto correspondiente a la introducción del tratamiento, 
B2; el correspondiente a su retirada y f3; el correspondiente a su reinstauración. 
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Para detectar los cambios aludidos bajo este segundo escenario extendemos la Ecuaciones 12.11 
y 12.12 (la correspondiente al periodo y al participante) y las escribimos directamente dentro de un 
modelo mixto o combinado que emplea las intercepciones y las pendientes aleatorias como respuestas: 


Yi: =Yo00 + (yo1 + 411) A1B151 + (Y20 + U2¡)B1 Az ¡1 + (Y30 + U2i) A2Boir + Uoi + js (12.13) 
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Figura 12.13.— Datos tomados con ligeras modificaciones de Lambert, Cartledge, Heward y Lo (2006). 


El nivel medio estimado en línea base, Yoo, el efecto medio estimado referido a la introducción del 
tratamiento, Y 10, el referido a la supresión, Yap, el referido a la posterior reinstauración, y30, la variación 
entre los participantes en dichas estimaciones y la covarianza entre las mismas, así como la estimación 
de la varianza dentro de los participantes se muestran en el cuadro 12.4 y representan el Modelo 2 (M>»). 

Por último, basados en el análisis visual de la figura 12.13 vamos a proceder a modelar los cambios 
de nivel y de tendencia que ocurren en la variable de respuesta a lo largo de las cuatro fases del diseño. 
Bajo esta nueva situación necesitamos introducir cuatro variables adicionales. La primera (T) se refiere 
ala tendencia, codificada de 1 a N paralas N sucesivas mediciones repetidas. La segunda (T>) recoge los 
cambios de tendencia posteriores a la intervención (interacción entre la administración del tratamiento 
y la tendencia), y es definida puntuando con 0 los k, (= na1 + 1) primeros registros, con 1 el segundo re- 
gistro posterior a la primera fase de control, con 2 el tercero y, así sucesivamente, hasta el último registro 
que se codifica con el valor T,— k;¡. La tercera variable (T3) recoge los cambios de tendencia posteriores 
a la supresión del tratamiento (interacción entre la supresión y la tendencia), que se define puntuando 
con 0 los k2(= 141 + Ng] + 1) primeros registros, con 1 el segundo registro posterior a la primera fase de 
intervención, con 2 el tercero y, así sucesivamente, hasta el último registro que se codifica con el valor 
T;— kz. Finalmente, la cuarta variable (T4) recoge los cambios de tendencia posteriores a la reinstaura- 
ción del tratamiento (interacción entre la reinstauración del tratamiento y la tendencia), y es definida 
puntuando con O los k3(= na] + Ng1 + Na2 +1) primeros registros, con 1 el segundo registro posterior a 
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la segunda fase de control, con 2 el tercero y, así sucesivamente, hasta el último registro que se codifica 
con el valor T; — k3. Para detectar los cambios aludidos bajo este tercer escenario extendemos el modelo 
combinado de la ecuación 12.13 mediante: 


Yi = 


Yoo + Y10T 151 + (Y20 +Y5072:1)41 B151 + (Y30 + Y60713:1)B1 4251 + (Yao + y70 7411) 42Bo;4 
+Upj + Us ¡Ti ¡+ (Up + Us Taj) A1B]¡p + (Uzj + Ug¡ Taj) B1Ao¡p + (Uy¡ + U7¡ Tai) A2Bojt + Cir 


(12.14) 


Como en los dos escenarios anteriores, los efectos estimados de los parámetros de efectos fijos y 
aleatorios se presentan en la cuadro 12.4 y se etiquetan como Modelo 3A (M3 4). También se muestran 
los efectos estimados de un modelo restringido que ofrece mejor ajuste y se etiqueta como Modelo 3B 


(M3g). 
CUADRO 12.4 
Resumen de los resultados del análisis multinivel del diseño A-B- A-B 
Modelos Mi Ma M3A M3B 
Efectos fijos Coeficiente(SE) | Coeficiente(SE) | Coeficiente(SE) | Coeficiente(SE) 
Nivel 6.85*** (0,41) 6.98*** (0,31) 6.56***(0.51) 6.88*** (0.57) 
Fase —5.46*** (0.35) 

Tiempo 0.10 (0.86) 0.05 (0.96) 
A1B1 =5.79*** (0.39) -5.74:*** (0.66) -5.86*** (0.70) 
B14> 5.42*** (0.46) 4.99*** (0.77) 4.46*** (0.80) 
AB) -5.09*** (0.35) -5.78*** (0.68) -5.61*** (0.74) 

A1B¡x T> 0.32 (0.20) —0.16 (0.22) 
B¡ 49 x Tz 0.62** (0.21) 0.52* (0.24) 
AoBo x Ta -0.60*** (0.15) -0.64** (0.17) 


Efectos aleatorios 


Parámetro (SE) 


Parámetro (SE) 


Parámetro (SE) 


Parámetro (SE) 


Varianzas Nivel-2 
Nivel 
Fase 
Tiempo 
A1B1 
B14>2 
AB) 
A1B¡x T> 
B142 x T3 
A) B» x Ta 
Varianzas Nivel-1 
q? 
AR(1) 


1.21 (0.71) 
0.54 (0.95) 


4.24*** (0.38) 


0.32 (0.27) 


0.45 (0.44) 


3.55*** (0.59) 


0.46 (0.33) 


0.15 (0.32) 


4.04*** (0.36) 


0.38 (0.31) 


4.18*** (0.41) 
0.23*** (0.07) 


Desvianza (q) 
AIC 
BIC 


1147.43(5) 
1159.43 
1180.88 


1151.53 (9) 
1169.53 
1201.71 


1133.57 (17) 
1167.57 
1228.37 


1121.96 (11) 
1143.96 
1183.30 


SE = Error estándar; q = n* parámetros; * P< 0.05; ** P <0.01; *** P< 0.001 (Véase sintaxis en página web) 


De acuerdo con la salida correspondiente al Modelo 3B, podemos concluir que bajo las tres oportu- 


nidades que brinda el diseño para demostrar la efectividad del tratamiento (cambio de nivel posterior 
a la presentación, supresión y restauración), éste se muestra estadísticamente significativo (P < 0.001). 
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También resultó significativa la interacción del tiempo con la supresión del tratamiento (P < 0.05) y la 
interacción del tiempo con la reinstauración (P < 0.001), lo que nos indica que se producía un aumento 
progresivo de las conductas disruptivas de los participantes cuando se retiraba la intervención y una 
disminución progresiva cuando se reinstauraba el programa. Sin embargo, este progreso o regreso no 
difería de unos sujetos a otros (las tendencias aleatorias del Modelo 3A no eran significativas). Como 
pone de relieve el modelo de intercepción aleatoria (Modelo 3B), los participantes tampoco diferencian 
unos de otros con respecto al valor promedio de la variable dependiente. 


B. Análisis multinivel de un DLBM entre participantes 


En la investigación conductual cada vez resulta más frecuente toparse con diseños de línea base 
múltiple (DLBM) que incluyen un elevado número de participantes (i.e., 5 0 más). Por lo tanto, en vez 
de analizar los datos de cada sujeto por separado con un análisis de la regresión, puede resultar más 
adecuado utilizar un análisis jerárquico de dos niveles, ya que este enfoque permite la estimación con- 
junta del efecto del tratamiento entre los participantes (cambio de nivel y cambio de pendiente), sin 
perder de vista la información acerca de cada participante individual. Además, al tenerse en cuenta que 
las ocasiones de medida se anidan dentro de los participantes, el análisis multinivel también permite 
modelar y estimar la variabilidad que manifiestan los efectos del tratamiento entre los participantes. 
Para ilustrar el modelado multinivel de un DLBM, se ofrece el análisis de los datos de McClannahan et 
al. (1999). El cuadro 12.5 recoge los datos de tres sujetos que participaron en el estudio. El primer parti- 
cipante tiene 6 observaciones en la fase de línea base (4) y 15 en la fase de tratamiento (B), el segundo 
tiene 11 observaciones en la fase A y 10 en la fase B, mientras que el tercero tiene 16 observaciones en 
la fase A y 5 en la fase B. 

Cuando se usa un DLBM el investigador puede hacerse diversas preguntas, entre las cuales cabe 
destacar las siguientes: (a) ¿Cuál es el valor de la respuesta al comienzo de la fase de línea base o al fi- 
nal si se utiliza la variable tiempo centrada (nivel)? (b) ¿Cuál es la tasa de cambio a lo largo del tiempo 
(tendencia o pendiente)? (c) ¿Existe un efecto inmediato del tratamiento (cambio de nivel)? (d) ¿La ten- 
dencia difiere a través de las fases (cambio de pendiente)? Si el tratamiento no tuviese ningún efecto en 
la respuesta de los participantes, uno esperaría que el primer punto de la serie de datos tras su intro- 
ducción permaneciese en el mismo nivel que el último punto de la fase A (ausencia de cambio de nivel) 
y que tampoco existiese ningún cambio en la tendencia exhibida durante la fase A (ausencia de cambio 
de pendiente). 

Inicialmente, nos vamos a centrar en estimar el efecto promedio del tratamiento (p. ej., nivel y cam- 
bio de nivel), así como en determinar la variabilidad que manifiesta dicho efecto a través de los parti- 
cipantes. Bajo este escenario, a las mediciones efectuadas durante la fase A se les asigna el valor cero, 
mientras que a las mediciones registradas durante la fase B se les asigna el valor uno. 

Para detectar los cambios aludidos, se formula a nivel 1 (mediciones repetidas) el modelo siguiente: 


Yir = boi + b1iFase;: + ej: (12.15) 


donde Y;, denota la respuesta emitida por del ¡-ésimo participante en el t-ésimo periodo, by; representa 
el nivel de la serie en la fase A para el ¡-ésimo participante, b,; es su correspondiente cambio de nivel 
(cambio de la condición de línea base a la condición de tratamiento) y e; es el término de error usual 
(mide la variabilidad que existe entre la respuesta dada por ¡-ésimo participante en el t-ésimo periodo 
y el promedio de respuestas emitidas por dicho participante a lo largo de la serie). 
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CUADRO 12.5 
Datos de McClannahan et al. (1990) 


ID; | Ti | T> | Fase | Y ID | T¡ To | Fase | Y ID3 | Ti | T2 | Fase 
A 0 0 0 70 A 0 0 0 50 A 0 0 0 
A 1 0 0 72 A 1 0 0 55 A 1 0 0 
A 2 0 0 80 A 2 0 0 45 A 2 0 0 
A 3 0 0 65 A 3 0 0 59 A 3 0 0 
A 4 0 0 76 A 4 0 0 42 A 4 0 0 
A 5 0 0 75 A 5 0 0 48 A 5 0 0 
B 6 0 1 86 A 6 0 0 60 A 6 0 0 
B ee 1 1 81 A 7 0 0 58 A 7 0 0 
B 8 2 1 85 A 8 0 0 52 A 8 0 0 
B 9 3 1 84 A 9 0 0 55 A 9 0 0 
B 10 4 1 84 A 10 0 0 66 A 10 0 0 
B 11 5 1 90 B 11 0 1 63 A 11 0 0 
B 12 6 1 95 B 12 1 1 73 A 12 0 0 
B 13 í 1 83 B 13 2 1 78 A 13 0 0 
B 14 8 1 94 B 14 3 1 75 A 14 0 0 
B 15 9 1 88 B 15 4 1 71 A 15 0 0 
B 16 | 10 1 87 B 16 5 1 84 B 16 0 1 
B 17 | 11 1 98 B 17 6 1 74 B 17 1 1 
B 18 | 12 1 92 B 18 7 1 88 B 18 2 1 
B 19 | 13 1 91 B 19 8 1 75 B 19 3 1 
B 20 | 14 1 90 B 20 9 1 78 B 20 4 1 


ID = Participante; T = Tiempo; Fase = Intervención; Y = respuesta 


Para modelar la variabilidad existente entre los participantes en los parámetros bp; de la ecuación 
12.15, a nivel 2 (participante) se usa el modelo incondicional siguiente: 


Doi 
bx; 


Yoo + Up;¡ (12.16) 


Y10 + Uy; 


donde Yoo denota el nivel promedio en línea base y yo1 indica el cambio de nivel promedio entre las dos 
fases adyacentes del diseño. A su vez, up; denota el efecto único del ¡-ésimo participante (mide la des- 
viación del nivel medio obtenido con cada participante del nivel medio general) y uy; denota el efecto 
único del ¡-ésimo participante (mide la desviación del cambio de nivel dentro de cada participante del 
cambio de nivel medio general). 

Seguidamente, procedemos a introducir dos nuevas variables explicativas en la ecuación 12.15 para 
comprobar si, además de un posible cambio de nivel, también existe una tendencia y/o un cambio de 
tendencia. La primera (T]) se refiere a la tendencia (tasa de cambio a lo largo del tiempo), se codifica de 
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0a (N—1) para las N sucesivas mediciones repetidas. La segunda (T>) recoge los cambios de tendencia 
posteriores a la intervención (interacción entre la administración del tratamiento y la tendencia), en este 
caso las primeros k; (= n4+1) registros se codifican con 0, el segundo registro posterior a la intervención 
con 1 y, así sucesivamente, hasta el último registro que se codifica con el valor T,— k,. La variable ficticia 
que recoge el efecto de la intervención se codifica como en el caso anterior. 

Para responder a las preguntas formuladas bajo el segundo escenario se formula el modelo a nivel 1 
(mediciones repetidas) siguiente: 


Yi = doi + b1¡Fase¡s + bo T1¡1+ b3T>¡1+€i1 (12.17) 


donde b>; representa la tasa de cambio a lo largo del tiempo para el ¡-ésimo participante y b3; su corres- 
pondiente cambio de tendencia entre fases (p. ej., cambio en la pendiente de la serie temporal debida 
al tratamiento). 

La ecuación a nivel 2 (participante) siguiente modela la variabilidad existente entre los participantes 
en los parámetros b; de la ecuación 12.17. En concreto, 


boi = Yoo +Uo¡ (12.18) 
Di = Yio+Uj 
boi = Y20+Uzi 
Di =  Y30+U3i 


donde y20 indica la tasa de cambio promedio a través del tiempo y y30 el cambio de tendencia promedio 
entre condiciones. A su vez, uz; denota el efecto único del ¡-ésimo participante (mide la desviación de 
cada pendiente específica de la pendiente promedio general) y uz; denota el efecto único del ¿—ésimo 
participante (mide la desviación del cambio de tendencia específico del cambio de tendencia medio 
general). Aunque este modelo no incluye ninguna variable explicativa de nivel 2, nada impide incluir 
características de los participantes. 

Los resultados de los efectos estimados de los parámetros de efectos fijos y aleatorios se presentan en 
el cuadro 12.6 y se etiquetan como Modelo 1 (M,) y Modelo 2a (M»¿). También se muestran los efectos 
estimados de un modelo restringido que ofrece un ajuste superior, y se etiqueta como Modelo 2b (Map). 

De acuerdo con la salida correspondiente al Modelo 2b, la respuesta media pronosticada al inicio 
de la fase A para los tres participantes es igual a Yoo = 64.79 y estadísticamente significativa: 1(2) = 
13.04; P = 0.006. El cambio de nivel promedio estimado que se produce a raíz de la introducción del 
tratamiento es igual a Y10 = 13.04 y estadísticamente significativo: 1(58) = 4.82; P < 0.001. Esto significa 
que el tratamiento tiene un efecto inmediato y positivo en la mejora de los hábitos higiénicos de los 
tres participantes. A su vez, la respuesta manifiesta un ligero incremento lineal promedio a través del 
tiempo, $20 = 0.49 y es también estadísticamente significativo: £(58) = 2.36; P = 0.03. 

Además de obtener una estimación de los efectos promediados para los tres participantes, también 
se pueden obtener los efectos específicos de cada participante utilizando el estimador de Bayes empí- 
rico!. El enfoque multinivel también permite realizar una estimación de la variabilidad de la respuesta 


l Para obtener estas estimaciones mediante el paquete SPSS sólo tenemos que añadir la sentencia '/SAVE =PRED' después de 
la declaración 'random' en el procedimiento MIXED que se describe en la página web del texto. 
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entre los participantes al comienzo de la fase de línea de base (fp ), del cambio de nivel medio a raíz de 
la presentación del tratamiento (71 ;), de la tendencia promedio a lo largo del tiempo (f>;) del cambio 
de tendencia promedio (f3;) y de la variabilidad dentro de los participantes (62) Para los datos de Mc- 
Clannahan et al. (1999) analizados aquí tan sólo se obtuvo una variabilidad significativa dentro de los 
participantes, 6 = 35.91: Z = 5.48, P < 0.001. Ninguna de las varianzas restantes (nivel, cambio de nivel, 
tendencia y cambio de tendencia) difería significativamente de cero. 


CUADRO 12.6 
Resumen de los resultados del análisis multinivel del DLBM 
M] Mza Mz» 
Efectos fijos Coeficiente(SE)  Coeficiente(SE) | Coeficiente(SE) 
Nivel 67.23*** (4.89) 65.67** (5.77) 64.79** (4.92) 
Cambio de nivel 18.11** (1.71) 12.56*** (2.62) 13.04*** (2.71) 
Tendencia 0.32 (0.30) 0.49* (0.21) 
Cambio de tendencia 0.45 (0.43) 
Efectos aleatorios Parámetro(SE) Parámetro(SE) Parámetro(SE) 
Varianzas Nivel-2 
Nivel 68.00(57.06) 91.56 (82.89) 66.09 (59.37) 
Cambio de nivel 
Tendencia 0.04 (0.07) 
Cambio de tendencia 
Varianzas Nivel-1 
a? 39.19*** (7.15) 33.11*** (6.38) 35.92*** (6.56) 
AR(1) 
Desvianza (q) 420.76 (5) 413.51 (9) 415.44 (5) 
AIC 430.76 431.51 425.44 
BIC 441.47 450.80 436.16 
SE = Error estándar; q = n* parámetros; * P < 0.05; ** P<0.01; *** P<0.001 


12.4.5. Las pruebas de aleatorización 


Para potenciar la validez de las inferencias conlos DCU se ha sugerido el empleo de pruebas basadas 
en la aleatorización (Edgington y Onghena, 2007; Kratochwill y Levin, 2010; Onghena y Edgington, 2005). 
En los DTA los tratamientos se asignan al azar a las ocasiones de medición o bajo alguna restricción 
(Onghena y Edgington, 1994). En los diseños A— B y en los diseños de reversión el comienzo de una 
fase se determina al azar (Edgington y Onghena, 2007). En los DLBM se pueden asignar al azar los 
participantes a las diferentes longitudes de línea de base (Wampold y Worsham, 1986), se pueden eligir 
al azar el momento de cambio de fase (Marascuilo y Busk, 1988), o se puede emplear el esquema de 
aleatorización dual (Koehler y Levin, 1998, 2000). Bajo este esquema, tanto el momento de cambio de 
fase como la asignación de los participantes a las líneas de base se realizan aleatoriamente. Para detalles 
acerca de la implementación de los diferentes esquemas de aleatorización, el lector interesado puede 
consultar Ato y Vallejo (2007). 

Para llevar a cabo el análisis mediante este tipo de prueba, se comienza determinando todas las 
posibles asignaciones al azar y eligiendo una de ellas, lo cual constituye el DCU propiamente dicho. 
Después se selecciona un estadístico de prueba adecuado (p.e., la diferencia de medias entre el pro- 
medio de las respuestas obtenidas en ausencia y presencia del tratamiento), se recogen los datos y se 
calcula dicho estadístico. Hecho lo anterior, se utilizan los datos recolectados en el diseño y se calcula el 
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valor de la prueba estadística para cada una de las posibles asignaciones aleatorias registradas al inicio 
del experimento. Finalmente, se obtiene la distribución empírica del estadístico ordenando los valores 
de la prueba estadística y se calcula la significación estadística del DCU. Para ello tan sólo se tiene que 
especificar el lugar que ocupa el estadístico de prueba en la distribución empírica de los posibles valores 
de la prueba estadística. Actualmente, el uso de pruebas de la aleatorización en el contexto de los DCU 
es limitado, debido a que la asignación aleatoria no siempre es factible. Otro inconveniente de estos 
análisis es que la magnitud del efecto del tratamiento no se puede estimar, tan sólo se puede decidir si 
el tratamiento es o no eficaz, que no es poco. 


12.5. CONSIDERACIONES FINALES 


Tradicionalmente, en la investigación operante donde los DCU son ampliamente utilizados, se ha 
enfatizado la importancia de escudriñar la relación funcional entre la manipulación experimental y los 
cambios conductuales, a través de inspecciones visuales más que por medios estadísticos. A nuestro 
modo de ver, este tipo de razonamiento es sostenido, por un lado, por la propia historia de la investiga- 
ción operante, en la cual se ha evitado e ignorado la evaluación de los cambios conductuales mediante 
la inferencia estadística y, por otro lado, por el argumento experimental esgrimido por estos teóricos, 
los cuales consideran a los criterios analíticos como contrarios al propósito de identificar tratamientos 
verdaderamente efectivos. Es decir, una investigación tan sólo será considerada efectiva en la medida 
que sea capaz de provocar cambios conductuales gráficamente visibles. De ahí que aún perdure la idea 
según la cual, los criterios estadísticos son opuestos y entran en conflicto con el principal objetivo de 
evaluar e identificar potentes cambios en las investigaciones con DCU. Sin embargo, la evaluación de 
los efectos de la intervención mediante la inspección visual de los datos representados gráficamente 
puede encerrar grandes dificultades cuando los datos presenten tendencias, dependencia serial y exce- 
siva variabilidad dentro y a través de las sucesivas fases. Además, la idea de descubrir tratamientos que 
produzcan cambios potentes es muy loable, pero en la práctica abundan más los que producen cambios 
débiles, aunque sean estables. Para vencer las dificultades expuestas, hemos abogado por complemen- 
tar los análisis visuales con métodos estadísticos, tales como el análisis de series temporales cortas, el 
análisis multinivel y las pruebas de aleatorización. 


12.6. SUGERENCIAS DE ESTUDIO 


Los diseños de caso único tienen abundantes aplicaciones en Psicología, avalados por una larga 
trayectoria de investigación que se remonta a los orígenes de la Psicología Experimental. Una idea de 
la riqueza y variedad de sus aplicaciones la aporta el trabajo de Shadish y Sullivan (2011), citado en la 
sección 12.3, donde se detectaron 809 diseños de caso único correspondientes a 113 estudios publicados 
durante el año 2008 en diversas revistas aplicadas de la Psicología y de la Educación, más de la mitad de 
los cuales fueron DLBM. 

Algunos detalles históricos de esta dilatada trayectoria pueden consultarse en Cook y Campbell 
(1986). Aunque más breve, también puede servir con esta finalidad Nock, Michel y Photos (2007). 

La literatura referida a la descripción, clasificación y análisis de los de los DCU es muy abundante, 
Los textos de Arnau (1984, 1995b, 1995c), Barlow y Hersen (1984), Kennedy, (2005), Vallejo y Ato (2007), 
Barlow et al. (2009), Kazdin (2011), Gast y Ledford (2014) y Bono y Arnau (2014) son especialmente reco- 
mendables para profundizar en esta temática. 


OEdiciones Pirámide 


Diseños no experimentales 


13.1. INTRODUCCIÓN 


Los diseños experimentales que se trataron en los capítulos 7 a 10 deben cumplir dos condiciones 
esenciales: 1) al menos hay una variable manipulada, y 2) las unidades experimentales se asignan al 
azar a los tratamientos (en el caso de los DMR controlando efectos de ssecuenciación). Los diseños 
que no cumplen con la segunda condición, pero sí con la primera, son los diseños cuasiexperimentales 
(que se trataron en el capítulo 11), y algunos diseños de caso único (que fueron objeto del capítulo 
12). Los diseños que no cumplen ninguna de las dos condiciones señaladas constituyen los diseños no 
experimentales. 

Dentro de la amplia categoría de diseños no experimentales se deben incluir en principio todos los 
estudios de la estrategia asociativa y los de la estrategia descriptiva (véase capítulo 6). Sin embargo, viene 
siendo tradicional en Psicología tratar separadamente los estudios de la estrategia manipulativa y aso- 
ciativa de los de la estrategia descriptiva (que son esencialmente, los diseños selectivos o de encuesta 
y los diseños observacionales)' porque suelen constituir asignaturas optativas propias de los planes de 
estudio en muchas de nuestras universidades). Probablemente la razón que justifique un tratamiento 
separado es que en la investigación actual muchos diseños de encuesta y observacionales de la estrate- 
gia descriptiva tienen una parte descriptiva, que representa su característica natural, y una parte analí- 
tica, que no representa su característica natural porque frecuentemente plantean hipótesis susceptibles 
de prueba empírica. Por esta razón este tipo de estudios requieren un tratamiento individualizado. 

En consecuencia, bajo la denominación de diseños no experimentales que tratamos en este capítulo 
se incluirán los estudios de la estrategia asociativa, que incluyen los estudios comparativos, predictivos 
y explicativos. Los diseños no experimentales difieren de los diseños experimentales porque no cum- 
plen ninguna de las dos condiciones esenciales, no existe ninguna variable manipulada ni asignación 
aleatoria a grupos o tratamientos. En lo esencial, seguiremos en este capítulo la clasificación propuesta 
por Ato et al. (2013b). 

Es común distinguir entre diseños cuasi-experimentales y no experimentales tomando como ba- 
se la condición de variable independiente manipulada directamente en los primeros (variables activas 
bajo el control del investigador), o la condición de variable manipulada indirectamente mediante se- 
lección en los segundos (variables atributivas o de clasificación fuera del control del investigador). Sin 


IReiteramos la confusión generada por la denominación de diseños observacionales, que tiene una dilatada tradición en Psico- 
logía, respecto de los diseños de la misma denominación que se emplean en Ciencias de la Salud para referirse en gran medida a 
los diseños que aquí llamamos comparativos y algunos diseños cuasiexperimentales. 
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embargo, habría que señalar que se trata de una división que no siempre resulta clara. También resulta 
difícil a veces distinguir entre un estudio no experimental comparativo y un estudio selectivo u ob- 
servacional. Aunque ambos emplean comparaciones inter e intrasujeto, la diferencia esencial entre un 
estudio comparativo y un estudio selectivo radica en que el objetivo del segundo es la representatividad 
de la muestra, objetivo que no es primordial en un estudio comparativo. La diferencia entre un estudio 
comparativo y un estudio observacional es que la finalidad del segundo es el realismo de la situación 
de observación, donde se observan los comportamientos en el mismo momento en que se producen, 
una finalidad que tampoco se presenta en un estudio comparativo, donde por lo general los comport- 
tamientos o ya se han producido (observación retrospectiva) o se producirán en el futuro (observación 
prospectiva) o se presentan dentro de un corto espacio temporal (observación transversal). 


13.2. ESTUDIOS COMPARATIVOS 


Los ESTUDIOS COMPARATIVOS analizan la relación entre variables examinando las diferencias que 
existen entre dos o más grupos de individuos, aprovechando las situaciones diferenciales creadas por 
la naturaleza o la sociedad. Son especialmente apropiados para evaluar la efectividad de programas o 
prácticas que involucran poblaciones humanas (Anderson et al., 1980, p.v). Puesto que son en esencia 
estudios no experimentales, no se utilizan variables manipuladas, o si se trata de variables que son sus- 
ceptibles de manipulación, no es posible manipularlas por razones éticas o administrativas, ni tampoco 
es posible la asignación aleatoria de los participantes. En su forma más característica estos estudios 
emplean como variables independientes variables atributivas o variables de clasificación, en oposición 
a variables medidas, que suelen ser más comunes en los estudios predictivos y explicativos, y a variables 
manipuladas, que son el foco de atención de los estudios experimentales y cuasiexperimentales. 

En Ciencias de la Salud y algunas Ciencias Experimentales, los estudios comparativos se conocen 
también como ESTUDIOS OBSERVACIONALES, porque el investigador no manipula variables ni realiza 
ningún tipo de intervención, sino que simplemente se limita a observar comportamientos de interés, 
fundamentalmente de carácter clínico. Se contraponen así alos ENSAYOS CLÍNICOS ALEATORIZADOS, que 
representan en estas áreas científicas a los estudios experimentales, y alos ENSAYOS CLÍNICOS CONTRO- 
LADOS, que representan los estudios cuasiexperimentales. No obstante lo anterior, conviene notar que 
todo estudio comparativo se realiza con la intención de imitar las condiciones de un ensayo clínico 
aleatorizado o controlado. La calidad y cantidad de evidencia proporcionada por un estudio compara- 
tivo está en gran medida determinada por su diseño (Rosenbaum, 2010, p. ix), pero se requiere mayor 
esfuerzo para evaluar su calidad metodológica (véase Jarde, Losilla y Vives, 2012). 

Los estudios comparativos suelen adoptar uno de varios enfoques temporales posibles, del que de- 
pende su denominación. En función del momento temporal, los individuos pueden ser observados 
prospectivamente (hacia adelante), transversalmente (en el momento actual) o retrospectivamente (ha- 
cia atrás), produciendo cuatro grandes alternativas de diseño: 


1. Un DISEÑO RETROSPECTIVO O EX POST FACTO se emplea cuando las variables han ocurrido antes 
del comienzo del estudio. La recogida de datos emplea datos de archivos ya existentes, pero el 
análisis estadístico y la interpretación de los resultados se realiza en el momento actual. 


2. Un DISEÑO TRANSVERSAL se utiliza cuando la definición de las variables se realiza concomitante- 
mente en el tiempo. La recogida de datos emplea archivos recientes y los resultados se interpretan 
también en el momento actual. 
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3. Un DISEÑO PROSPECTIVO O LONGITUDINAL se usa cuando las variables se observan al comenzar 
el estudio y se prolongan hacia adelante a lo largo del tiempo, en cuyo transcurso se recogen los 
datos, por lo que el análisis y la interpretación de los resultados tiene que esperar hasta que se 
considera completada la investigación. 


4. Un DISEÑO EVOLUTIVO es un diseño prospectivo donde el interés se centra en evaluar los cambios 
que son función de la edad o el desarrollo. 


Dentro de esta clasificación general se engloban un amplio conjunto de diseños de investigación, 
observados en numerosas aplicaciones de la Psicología, las Ciencias Sociales y las Ciencias de la Salud. 


13.2.1. Diseños comparativos retrospectivos o ex post facto 


Los estudios retrospectivos utilizan información histórica para remontarse hacia atrás en el tiem- 
po examinando eventos que han tenido lugar con anterioridad y de ahí su denominación alternativa 
de ex-post-facto (véase Suchman, 1967). Aunque el periodo temporal objeto del estudio puede abarcar 
muchos años, una ventaja de los estudios retrospectivos es el escaso tiempo que se tarda en completar, 
puesto que sólo se requiere registrar primero y analizar e interpretar los resultados después. Por esta 
razón son particularmente útiles para estudiar la asociación entre variables que no ocurren frecuente- 
mente o son difíciles de predecir o cuando existe un largo intervalo temporal entre una supuesta causa 
y su efecto. Son típicos de la investigación en Ciencias de la Salud (en particular, la Salud Mental y la 
Epidemiología; véase Mann, 2003), desde donde se han importado a disciplinas afines tales como la 
Psicopatología y la Psicología Clínica. En el contexto clínico, los estudios retrospectivos representan el 
método más apropiado para determinar la incidencia e historia natural de un trastorno psicológico. En 
algunos contextos se utilizan incluso en lugar de los experimentos para plantear hipótesis causa-efecto 
en situaciones donde no es posible o no es ético utilizar variables manipuladas. 

Pueden diferenciarse dos tipos de estudios retrospectivos (figura 13.1), dependiendo de si la de- 
finición de los grupos de participantes se establece en base a la variable independiente o la variable 
dependiente (véase Cohen, Manion y Morrison, 2012; Kirk, 2013). 


— En el DISEÑO RETROSPECTIVO DE COHORTE, se utilizan bases de datos ya existentes para identificar 
la cohorte del estudio, es decir, el conjunto de individuos de una población que participan de una 
característica común. Se definen dos grupos de sujetos seleccionados de la cohorte del estudio 
en función de si han sido o no expuestos a un factor de riesgo (la VI), y después se comparan en 
una o más VD/s (si la VD es categórica, empleando índices de incidencia, riesgo relativo, razón 
de *odds' o estadísticos afines, como veremos más adelante). La cohorte del estudio representa 
en este contexto a una muestra de sujetos que han experimentado un evento significativo (p.e., 
nacimiento, divorcio o condición psicopatológica) durante un determinado intervalo temporal, y 
tiene que estar claramente definida para considerar viable este tipo de diseño. 


— Por el contrario, en el DISEÑO RETROSPECTIVO CASO-CONTROL, o sencillamente DISEÑO CASO CON- 
TROL, las bases de datos ya existentes o recopiladas mediante entrevista o cuestionario se utilizan 
para identificar dos grupos de sujetos (que no pertenecen a una cohorte) en función de si mues- 
tran evidencia de la VD (los casos) o no la muestran (los controles), y después se comparan en 
términos de su exposición previa a las VI/s. El análisis de los datos suele utilizar, entre otros, índi- 
ces tales como la razón de 'odds”. 
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Por ejemplo, supongamos que un investigador se interesa por estudiar la asociación entre asistencia 
a centros de Educación Infantil (la VD) y rendimiento académico en niños de Primaria (la VD). Si se 
empleara un diseño de cohorte retrospectivo, el investigador podría definir dos grupos de niños de una 
cohorte específica (p. ej., niños nacidos en el 2000), que difieren por haber asistido o no a centros de 
Educación Infantil, y después compararía el rendimiento académico medio obtenido en Primaria entre 
ambos grupos. Es decir, se define primero la VI de forma retrospectiva y se mide ahora la VD ahora. 
Si por el contrario se empleara un diseño retrospectivo caso-control, el investigador podría definir dos 
grupos de niños que muestran diferencias en rendimiento académico en Primaria (casos y controles), 
pero no pertenecen a una cohorte específica, y después examinaría retrospectivamente para cada caso 
y control la asistencia a cursos de Educación Infantil en sus primeras etapas. Es decir, se define primero 
la VD en el momento actual y se evalúa después retrospectivamente la VI. 


DISEÑOS COMPARATIVOS RETROSPECTIVOS 


Retrospectivo Transversal Prospectivo 
——>>> A ——_——=> 
: tiempo : 
: ahora 


Diseño retrospectivo de cohorte 


Se define primero la cohorte del estudio. VD 
Los grupos (GE-GC) se forman 
retrospectivamente en la VI. 
Se registra ahora la VD. 
Después se interpretan los resultados. 


Diseño retrospectivo caso-control : 
VI 


Los grupos (GE-GC) se forman ahora en la VD. 
Los grupos no provienen de cohortes. 
Se examina retrospectivamente la VI. 
Se interpretan después los resultados. 


X = Recogida de datos 
R = Reporte de resultados 


Figura 13.1. — Tipología de los diseños comparativos retrospectivos. 


Muchos estudios retrospectivos utilizan como herramientas estadísticas el análisis de regresión nor- 
mal (u otros modelos de la estructura LM) si la VD es numérica, el análisis de regresión de Poisson si la 
VD es de recuento y el análisis de regresión logística si la VD es categórica (véase capítulo 1, secciones 
1.3.1 a 1.3.3). Dos de los índices estadísticos derivados de tales análisis son de especial aplicación en 
este contexto, en concreto el RIESGO RELATIVO (RR) y la RAZÓN DE odds (OR, odds ratio). Utilizando el 
ejemplo anterior, supongamos que el investigador utiliza un punto de corte para considerar el rendi- 
miento académico en primaria como apropiado (p. ej., rendimiento medio o alto, promedio superior a 
5 puntos) o inapropiado (p. ej., rendimiento bajo, promedio inferior a 5 puntos). En tal caso se podría 
definir una tabla de contingencia como la que se presenta en el cuadro 13.1, donde puede definirse el 
riesgo relativo (RR) como la razón de la probabilidad de que un evento ocurra en un grupo (p. ej., el GE, 
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compuesto de niños que asistieron a escuelas infantiles) respecto a la probabilidad de que ocurra en el 
otro (p. ej., el GC, compuesto de niños que no asistieron a escuelas infantiles), y se formula (Schmidt y 
Kohlmann, 2008): 


_al(a+ b) 
=el(e+d) 
CUADRO 13.1 
Tabla de contingencia Rendimiento en función de Asistencia 
Asistencia a Rendimiento académico 
escuelas infantiles | Apropiado | Inapropiado 
sí a b 
no Cc d 


La interpretación es simple. Una RR = 1 implica que no hay diferencias entre los grupos, mientras que 
un RR > 1l indica que el evento es más probable que ocurra en el GE que en el GC, y un RR< 1 apunta 
que es más probable que ocurra en el GC que en el GE. 

Para la misma tabla de contingencia pueden definirse también razones de probabilidad ('odds”). Así, 
la razón de probabilidad u 'odds' (O) de tener un rendimiento académico medio-alto entre los que asis- 
tieron y los que no asistieron a las escuelas infantiles es O; = a/c y del mismo modo la razón de proba- 
bilidad u 'odds' de tener un rendimiento bajo entre los que asistieron y los que no asistieron a escuelas 
infantiles es O, = b/d. La razón de 'odds' (OR) se define entonces como la razón entre ambas 'odds', que 
es en definitiva el producto de los valores diagonales de la tabla de contingencia: 


Ml alc_ axd 
=bld bxc 


La interpretación es también simple. Una OR = 1 significa que el asistir a escuelas infantiles no afecta a la 
respuesta, mientras que OR > l indica que asistir a escuelas infantiles se asocia con mejor rendimiento 
académico y OR < l indica que asistir a escuelas infantiles se asocia con peor rendimiento académico. El 
índice RR es más frecuentemente usado en diseños de cohorte (prospectivos y retrospectivos), mientras 
que el índice OR es más usual en diseños caso-control. 

Un rasgo típico de los diseños retrospectivos es su interés en formular hipótesis del tipo causa-efecto 
con el objeto de reproducir las características de la metodología experimental en un contexto no expe- 
rimental y con variables que no son susceptibles de manipulación. De hecho, en la investigación edu- 
cativa los diseños retrospectivos o ex post facto se denominan también diseños causal-comparativos (p. 
ej., Brewer y Kuhn, 2010; Gay, Mills y Airasian, 2012), mientras que en la literatura estadística se corres- 
ponden en cierta medida con los diseños de experimentos inversos (Loy, Goh y Xie, 2002). 

Sin embargo, es importante destacar la existencia de numerosas amenazas potenciales contra la va- 
lidez interna en los diseños retrospectivos. Shadish et al. (2002, p.131-133) discuten hasta 53 amenazas 
generales contra la validez en el diseño caso-control, lo que hace prácticamente inviable el estableci- 
miento de relaciones causales en estos estudios (pero véase un argumento contrario en Farrant, 1977). 
Además, cuando se emplean datos de autoreporte en los que el sujeto intenta recordar sucesos pasados, 
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el sesgo de recuerdo (recall bias) es una amenaza seria contra la validez interna (Hassan, 2006). Con to- 
do, los estudios retrospectivos o ex post facto suelen encontrar relaciones interesantes, que pueden ser 
ulteriormente objeto de investigación experimental. En ocasiones, también es posible utilizar procedi- 
mientos de control sofisticados para conseguir condiciones similares a las obtenidas mediante diseños 
que permiten crear condiciones idóneas para establecer relaciones causa-efecto. 


Un ejemplo de diseño retrospectivo de cohorte 

Objetivos. González-Valenzuela et al. (2014) se propusieron evaluar la influencia potencial de la oxi- 
tocina administrada durante el parto (VI) sobre el retraso evolutivo en niños de 5 años de edad (VD). 
Los niños de madres que recibieron oxitocina durante el parto constituyeron el GE (cohorte expuesta), 
mientras que los de madres que no recibieron oxitocina constituyeron el GC (cohorte no expuesta). 
Método. De una población total de 7465 partos atendidos en salas de maternidad del Hospital 
Materno-Infantil de Málaga en 2006 (cohorte del estudio), se seleccionó al azar una muestra inicial 
de 400 partos, a partir de la cual se tuvo finalmente acceso a un total de 148 niños que constituyeron 
la muestra del estudio (los padres de los 252 restantes rehusaron participar). Todos los participantes 
fueron evaluados con el Inventario evolutivo de Battelle sobre la presencia de retrasos evolutivos. Los 
niños del grupo experimental fueron emparejados con los niños del grupo control en las variables se- 
xo, duración de la gestación y peso al nacer, mediante emparejamiento de grupo. Los autores contro- 
laron también la edad, el nivel educativo y el hábito de fumar de la madre, las complicaciones durante 
el embarazo, el tipo de embarazo (espontáneo, instrumental o mediante cesárea) y la puntuación en 
la escala de Apgar. Para el análisis estadístico se empleó análisis de regresión logística. 

Resultados. Los resultados demostraron que en general el uso de la oxitocina no afectó significa- 
tivamente a la razón de 'odds' de sufrir retraso en el desarrollo en la muestra del estudio (OR = 
1.46, 1C95% : 0.79 — 2.71). Sin embargo, el riesgo de sufrir retraso en el desarrollo fue alto cuando la 
edad de la madre era menor de 28 o mayor de 35 años (OR = 67.1: 1C95%: 5.5 — 825.9) y muy bajo o 
nulo cuando el parto fue instrumental o mediante cesárea (OR = 0.16, /C95% : 0.04 — 0.66). 


Un ejemplo de diseño retrospectivo caso-control 

Objetivos. Gruber, Pope, Hudson y Yurgelun-Todd (2003) se interesaron por conocer las características 
diferenciales de los grandes consumidores a largo plazo de cannabis, la droga ilegal más frecuente- 
mente usada en EE.UU. 

Método. Se obtuvo un gran número de medidas de naturaleza demográfica y psicológica de un grupo 
de 108 individuos, de entre 30 y 55 años de edad, que habían sido grandes consumidores de cannabis 
(en concreto, habían consumido la droga entre 5000 y 18000 veces a lo largo de sus vidas), que trataron 
como grupo experimental o grupo de 'casos” y los compararon con otro grupo de 72 individuos (grupo 
control o grupo de 'controles') que habían sido también consumidores de cannabis, pero solo ocasio- 
nalmente (en concreto, habían consumido en promedio entre 1 y 50 veces a lo largo de sus vidas), que 
trataron como grupo de control. Los grupos fueron emparejados en varias variables potencialmente 
confundidoras mediante puntuaciones de propensión. 

Resultados. No se encontraron diferencias significativas entre los dos grupos en nivel de ingresos eco- 
nómicos y educación de sus familias de origen. Sin embargo, después de ajustar un gran número de 
potenciales variables confundidoras se encontraron diferencias entre grupos en las mismas variables 
entre casos y controles. En concreto, los participantes en el grupo de casos reportaron más bajo nivel 
educativo alcanzado (P < .001) y menores ingresos económicos (P = .003), que el grupo de controles. 
La valoración subjetiva del grupo de casos de los efectos del cannabis sobre su cognición, memoria, 
vida social, profesión y salud física y mental fue 'muy negativa”. También el grupo de casos reportó más 
bajos niveles de satisfacción que el grupo de controles en varias medidas de calidad de vida. 
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13.2.2. Diseños comparativos transversales 


A diferencia de los diseños comparativos retrospectivos, los diseños comparativos transversales se 
definen en un momento temporal determinado y examinan las diferencias entre las unidades de análi- 
sis en un corte transversal. Siguen una tradición eminentemente asociativa donde el interés por el esta- 
blecimiento de relaciones causa-efecto es secundario. Mientras los diseños retrospectivos (y prospecti- 
vos) de cohortes son el mejor medio para evaluar cuestiones de incidencia (o sea, se proponen estimar 
el número de nuevos casos que se desarrollan durante un intervalo temporal específico), los diseños 
transversales se utilizan primordialmente para evaluar cuestiones de prevalencia (o sea, se proponen 
determinar el número de casos que existen en una determinada población en un momento temporal 
específico). Los diseños transversales son además idóneos para el estudio de variables dependientes 
que permanecen estables en el tiempo, es decir, que no se asumen susceptibles de cambio. 

Distinguimos tres grandes formas de diseños transversales, cuyas características generales se mues- 
tran en la figura 13.2: el diseño de cohorte transversal, el diseño de grupos naturales y el diseño transcul- 
tural. 


DISEÑOS COMPARATIVOS TRANSVERSALES 


Retrospectivo Transversal Prospectivo 
t X 
lempo : : 
p : ahora 


Grupos formados en la VÍ. h 
La/s muestra/s representan cohortes. ¡Cohorte transversal 
Se evalúan prevalencia, no incidencia. : 
Se registran simultáneamente VI y VD. ; VD 


Grupos formados en Vis estables, y ' 
pertenecientes a una misma cultura. : Grupos naturales 
Se comparan diferencias individuales. : 
La/s muestra/s no representan cohortes; VD 
Se registran simultáneamente VI y VD. : 


Grupos de diferentes culturas. ; 
Las muestras no representan cohortes.; — Transcultural 
Se comparan diferencias entre culturas. : 
Se registran simultáneamente VI y VD. : VD 


X= Recogida de datos 
R= Reporte de resultados 


Figura 13.2. — Tipología de los diseños comparativos transversales. 


En Epidemiología y Psicopatología, los diseños transversales utilizan uno o más grupos de sujetos 
participantes que son evaluados en una o más variables de respuesta observadas en un espacio temporal 
próximo. El más simple, pero menos utilizado, de todos es el DISEÑO DE COHORTE TRANSVERSAL (véase 
Hudson, Pope y Glynn, 2005), que utiliza una muestra seleccionada de una cohorte de forma transversal 
y evalúa actualmente la historia de exposiciones (o sea, la/s VI/s) y de resultados (o sea, la/s VD/s) en 
los miembros de la muestra en un periodo de tiempo limitado. Es obvio que, como consecuencia del 
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proceso de muestreo, puede ocurrir que algunos participantes no habrán tenido exposición ni habrán 
experimentado resultado alguno. Esta es una diferencia esencial con los estudios de cohorte (retrospec- 
tivos y prospectivos), donde el historial de exposiciones y/o resultados afecta a todos los sujetos de la 
cohorte. Lo esencial, sin embargo, es que las VI y VD se definen de forma transversal. Chochinov et al. 
(2002) y Ghazan-shahi, Roberts y Parker (2009) presentan ejemplos típicos de aplicación de este diseño. 

Siguiendo a Hudson et al. (2005, p. 356), supongamos que se plantea como hipótesis que el trastorno 
por déficit de atención e hiperactividad (TDAH) es un factor de riesgo para la depresión y el abuso del 
alcohol en adolescentes de 13 a 18 años en una determinada comunidad. Para probar esta hipótesis con 
un diseño de cohorte transversal pueden entrevistarse a todos los adolescentes (varones y mujeres) de 
13 a 18 años de una comunidad que todavía viven en ella (cohorte del estudio), se miden en una o más 
VDs (p. ej., las variables diagnóstico de TDAH, historial de uso de alcohol y diagnóstico de depresión), 
y se clasifica a los adolescentes en función del nivel de TDAH, que es la VI del estudio. En consecuen- 
cia, la VI y la VD se registran de forma transversal (no retrospectiva). Entre otras alternativas analíticas, 
después podría analizarse la asociación entre las VIs y el desarrollo de trastornos depresivos y/o uso de 
alcohol y concluir si se asocian o no significativamente con los factores de riesgo empleando indica- 
dores al uso como razones 'odds,, riesgo relativo, estadísticos de asociación para variables numéricas o 
categóricas y estadísticos de acuerdo (véase Ato y López, 1996, Grupo ModEst, 2000b). 


Un ejemplo de diseño de cohorte transversal 

Objetivos. Ghazan-shahi et al. (2009) se propusieron examinar la estabilidad del diagnóstico DSM-IV 
en niños y adolescentes durante el periodo comprendido entre la niñez y la adolescencia temprana y 
discutir su inestabilidad desde una perspectiva evolutiva. Los grupos diagnósticos del DSM-IV defi- 
nidos en el estudio fueron: trastornos del estado de ánimo, trastornos de ansiedad, psicosis, trastornos 
de conducta, abuso de sustancias, trastornos de personalidad y otros. 

Método. Se empleó un diseño de cohorte transversal para evaluar la congruencia del diagnóstico DSM 
en niños y adolescentes que tuvieron una evaluación diagnóstica al menos dos veces como pacientes 
(internos y/o externos) en un hospital universitario de los Estados Unidos desde los 5 a los 22 años. 
Con esta finalidad, de la base de datos del hospital se definió la cohorte del estudio, que incluyó a todos 
los niños nacidos entre 1983 y 1985 que habían sido pacientes de la División de Psiquiatría de Niños 
y Adolescentes del hospital (un total de 427 pacientes), de donde se seleccionó una muestra final de 
264 pacientes que habían tenido una evaluación diagnóstica en al menos dos ocasiones durante un 
periodo de 17 años. 

El análisis estadístico utilizó tasas de concordancia positivas y negativas y coeficientes de acuerdo. La 
tasa de concordancia positiva determina la proporción de casos que recibieron el mismo diagnóstico 
en hospitalizaciones sucesivas, mientras que la tasa de concordancia negativa es la proporción de 
casos que no recibieron el mismo diagnóstico. El coeficiente de acuerdo x (kappa) proporciona una 
estimación del acuerdo más allá de lo esperado por azar. Los valores de x oscilan de +1 (acuerdo 
perfecto) a —1, representando el valor '0” el acuerdo esperado por azar. 

Resultados. Se observó en general baja estabilidad para todos los diagnósticos, pero porcentajes más 
altos de casos estables se dieron en trastornos del estado de ánimo y psicosis, mientras que los tras- 
tornos conductuales y los trastornos de ansiedad arrojaron los porcentajes más bajos. 


Obviamente, el ejemplo del TDAH podría haberse realizado empleando un diseño de cohorte pros- 
pectivo, definiendo las Vs y demorando en el tiempo el registro de las VDs, pero requeriría décadas 
para ser completado. También puede realizarse empleando un diseño de cohorte retrospectivo, pero 
solo sería factible si se dispusiera de una cohorte enumerada de individuos de la comunidad. Del mis- 
mo modo podría servir también un diseño retrospectivo caso-control, por ejemplo registrando casos de 
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depresión y abuso del alcohol en centros usuales de tratamiento, pero el problema en este caso es que 
muchos individuos con estos problemas no se encuentran en centros de tratamiento. 

En muchas áreas de la psicología aplicada el diseño comparativo transversal más frecuentemente 
usado es sin embargo el DISEÑO CON GRUPOS NATURALES (véase Shaughnessy, Zechmeister y Zechmeis- 
ter, 2012, p. 217-219), cuyo objetivo es la comparación en una o más variables de respuesta de grupos 
preexistentes, donde los grupos se seleccionan usando participantes que pertenecen a diferentes nive- 
les de variables que son fuentes relativamente estables de diferencias individuales (p. ej., edad, sexo, 
inteligencia, grupo étnico, trastorno psicopatológico, etc.), y que son miembros de una misma cultura. 
Por ejemplo, algunos estudios han demostrado que es más probable que reciban tratamiento psicoló- 
gico los individuos separados o divorciados (GE) que los casados, viudos o solteros (GC). Sobre la base 
de estos estudios se pueden analizar perfiles diferenciales del grupo de separados/divorciados respec- 
to del grupo de casados/viudos/solteros en términos de problemas psicológicos comunes (p.e. Blanco, 
Aguirre, Rodríguez-Villalobos, Blanco y Medina, 2014). 


Un ejemplo de diseño de grupos naturales 

Objetivos. Introzzi, Urquijo y López-Ramón (2010) investigaron los procesos de codificación y las fun- 
ciones ejecutivas en pacientes con esclerosis múltiple. Aunque el déficit en la memoria episódica en 
pacientes con esclerosis múltiple constituye un dato bien establecido, aún no existe acuerdo respecto 
al origen de este trastorno en términos de procesos cognitivos. Mientras la mayoría de los estudios lo 
atribuyen a defectos en los procesos mnésicos de recuperación, otros aportan evidencia en favor de 
la hipótesis que considera que el problema se origina por las dificultades en los procesos de codifica- 
ción. Pero el análisis de la relación entre los procesos de codificación y el funcionamiento mnésico en 
esta patología es un tema escasamente estudiado. 

Método. Se analizaron los procesos de codificación y sus relaciones con los procesos de control eje- 
cutivo en un grupo de 36 pacientes con esclerosis múltiple (GE). Para la evaluación de los proce- 
sos de codificación se utilizó un conjunto de índices del TAVEC (Test de Aprendizaje Verbal España- 
Complutense) y para los procesos ejecutivos una tarea de fluencia verbal semántica y la escala de ma- 
trices del WAIS-III. Un grupo de 36 participantes sanos, que fueron emparejados con los pacientes de 
esclerosis múltiple en edad y nivel educativo (GC), sirvió como grupo de control. 

Resultados. Los resultados, que se analizaron con ANCOVA y MANCOVA (ANCOVA multivariante), 
mostraron un déficit en los procesos de codificación y la existencia de una asociación significativa 
entre estos procesos y el funcionamiento ejecutivo en pacientes con esclerosis múltiple. 


Existe una gran flexibilidad en la aplicación del diseño de grupos naturales. En algunas investigacio- 
nes, se aprovecha un grupo de individuos (p. ej., sujetos con dislexia específica) y se busca un grupo de 
controles emparejados en potenciales variables extrañas (p. ej., edad, nivel educativo, inteligencia), para 
comparar las características distintivas del grupo de casos (p. ej., Suárez y Cuetos, 2012). En otras inves- 
tigaciones, los grupos se obtienen segmentando por la mediana o por cuartiles las puntuaciones de una 
muestra de participantes en una medida (p. ej., una escala de alexitimia), y se analizan después las ca- 
racterísticas distintivas entre los grupos en un conjunto de VDs (p. ej., Martínez, Montero y de la Cerra, 
2002). También puede darse el caso de más de dos grupos naturales y uno o ningún grupo de control (p. 
ej. Contador-Castillo, Fernández-Calvo, Ramos, Cacho y Rodríguez, 2009; Solano y Cano, 2012). 

Un rasgo singular del diseño comparativo de grupos naturales que lo diferencia del diseño retrospec- 
tivo caso-control es que el grupo de control no se registra retrospectivamente, sino simultáneamente al 
grupo experimental. Y similarmente, el rasgo distintivo que lo diferencia con el diseño transversal de 
cohorte es que los grupos que se comparan no pertenecen a ninguna cohorte específica. Cuando se 
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emplea con pretest, el diseño comparativo con grupos naturales es en muchos aspectos el equivalente 
no experimental del diseño cuasiexperimental DGNE, que es también el más frecuente de todos los 
diseños cuasiexperimentales. 

Cuando los grupos naturales pertenecen a culturas diferentes el resultado es el DISEÑO TRANSCUL- 
TURAL (Escotet, 1977; Matsumoto y van Vijver, 2011), donde la comparación involucra grupos de indi- 
viduos que viven en países o comunidades con diferentes etnias, lenguas o formas de vida (p.e., Acosta, 
Llopis, Gómez y Pineda (2005). El desarrollo de influyentes encuestas transculturales, tales como la Eu- 
ropean Social Survey o el Program for International Assessment of Students' Achievements (PISA), ha po- 
pularizado este tipo de investigaciones y ha permitido la explotación de nuevas opciones analíticas (en 
particular, el análisis multinivel) que no habían sido previamente consideradas (véase Davidov, Schmidt 
y Billiet, 2011; Grad y Vergara, 2003). 

Los estudios transversales requieren por lo general esfuerzos mínimos en economía y tiempo y sue- 
len ser bastante eficientes cuando se proponen hipótesis asociativas, pero suelen plantear serios pro- 
blemas de validez cuando se proponen hipótesis causa-efecto. Por ejemplo, se puede afirmar que los 
divorciados tienen mayor probabilidad de recibir tratamiento psicológico que los casados (o sea, que 
hay una relación de covariación entre estado civil y problemas emocionales), pero sería muy arriesgado 
concluir que el divorcio causa problemas emocionales. 


Un ejemplo de diseño transcultural 

Objetivos. Gómez-Peresmitré y Acosta (2002) investigaron si la menor insatisfacción con la imagen 
corporal encontrada en adolescentes españolas, en comparación con adolescentes mexicanas de la 
misma edad, podría generalizarse a adolescentes más jóvenes. 

Método. Para dar respuesta al problema planteado se empleó un diseño transcultural que implica 
comparar dos muestras de adolescentes jóvenes, emparejadas en edad, escolaridad y ocupación de 
los padres. La muestra final del estudio se compuso de 64 adolescentes españolas y 69 adolescen- 
tes mexicanas. Todas las participantes fueron evaluadas mediante escalas visuales de satisfacción- 
insatisfacción y a través de los ítems que miden sobre/subestimación, peso deseado, estimaciones 
subjetivas del peso corporal e índice de masa corporal de un instrumento que explora Imagen Corpo- 
ral y Conducta Alimentaria de Riesgo, desarrollado en una investigación anterior. 

Resultados. Se encontró un patrón de respuesta indicando: 1) satisfacción con la imagen corporal en 
españolas e insatisfacción en las mexicanas, y 2) existencia de un modelo ideal compartido entre 
las adolescentes mexicanas. Los resultados fueron analizados con ANOVA factorial utilizando como 
factores nacionalidad y sexo y apuntaron un efecto interactivo de sexox nacionalidad en la satisfac- 
ción/insatisfacción con la imagen corporal, F(1,110) = 6.983, P = .009, y efectos de nacionalidad en 
la preocupación por el peso corporal, F(1,129) = 72.672; P < .001, alteración de la imagen corporal, 
F(1,125) = 17.025, P<.001 y peso deseado, F(1, 129) = 6.001, P = .016, pero no se encontraron diferen- 
cias en el índice de masa corporal. 


13.2.3. Diseños prospectivos o longitudinales 


En los estudios prospectivos o longitudinales, las variables independientes y dependientes se ob- 
servan después de haberse iniciado la investigación (aunque la variable independiente puede en oca- 
siones referirse a una situación anterior). De ahí que el coste económico y el tiempo requerido para 
completar un estudio prospectivo sea mucho mayor que el requerido por un estudio retrospectivo o 
transversal, aunque como contrapartida puede mejorarse sensiblemente su fiabilidad. Y debido a su 
condición de longitudinal, algunas de las potenciales amenazas contra la validez interna de los estudios 
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retrospectivos no se consideran en los estudios prospectivos. A pesar de todo, los inconvenientes para 
el establecimiento de relaciones causa-efecto siguen siendo patentes, principalmente los problemas de 
sesgo y de confundido, que además se agravan como consecuencia del abandono de sujetos ('attrition') 
Cattrition”), deserciones que suelen producirse en mayor grado cuanto más se prolonga en el tiempo el 
estudio. 

Aunque los estudios prospectivos o longitudinales proporcionan mucha más información que sus 
homólogos retrospectivos, tampoco están exentos de limitaciones. En lo que respecta a las Ciencias del 
Comportamiento, Gibbons et al. (2010) destacan las cuatro siguientes: 


— la heterogeneidad observada y no observada (latente) debida a diferencias individuales entre in- 
dividuos, que produce desviaciones específicas de sujeto de la pauta de respuesta temporal, 


— los errores de medida correlacionados producidos por ocasiones de medida cercanas en el tiempo, 


— la a veces dramática presencia de datos perdidos por abandono de sujetos ('attrition”), una cues- 
tión siempre presente en estudios longitudinales; 


— la aparición de observaciones agrupadas ('clustered”) dentro de unidades de agregación (clases, 
escuelas, hospitales, comunidades, etc.), que producen una fuente adicional de correlación que 
viola el supuesto de independencia de las medidas. 


Sin embargo, desde la aparición de un pionero trabajo de Laird y Ware (1982), los métodos estadísti- 
cos para el análisis de datos longitudinales han avanzado extraordinariamente, en estrecho paralelismo 
con el incremento en el número de estudios longitudinales publicados (Singer y Willet, 2005; Bono, Ar- 
nau y Vallejo, 2008). Los métodos tradicionales derivados del enfoque univariante (Regresión, ANOVA y 
ANCOVA) y multivariante (MANOVA, MANCOVA y GMANOVA, una generalización del MANOVA apro- 
piada para analizar modelos de curvas de crecimiento, Growth Curve Models), son de uso limitado en es- 
te contexto como consecuencia de los supuestos restrictivos que tienen que cumplir (Arnau y Balluerka, 
2004; Arnau y Bono, 2008). Como tratamos en los capítulos 9 y 10, el enfoque univariante debe cumplir 
el supuesto de esfericidad y el enfoque multivariante sólo puede incluir sujetos con datos completos, lo 
que requiere eliminar a todos aquellos sujetos que tengan datos perdidos a lo largo del proceso longitu- 
dinal. Dadas estas limitaciones, tres grandes alternativas analíticas, que se corresponden puntualmente 
con las tres principales estructuras de modelado estadístico que se trataron en el capítulo 1, son de in- 
terés con estudios comparativos longitudinales (véase Fitzmaurice, Davidian, Verbeke y Molenberghs, 
2009; Fitzmaurice, Laird y Ware, 2011; Hedeker y Gibbons, 2006; Gibbons ef al., 2008; Twisk, 2003): 


1. La primera alternativa es la metodología del ENFOQUE DE LOS MODELOS MIXTOS (o más breve- 
mente, el ENFOQUE MIXTO), desarrollada para modelos con estructura GLMM, cuyo principal ex- 
ponente son los MODELOS DE REGRESIÓN MULTINIVEL, que ya hemos tratado con cierto detalle 
en los capítulos 5, 9, 10 y 12. Los modelos multinivel se adaptan muy bien al análisis de mode- 
los de medidas repetidas y de curvas de crecimiento. Entre sus principales ventajas destacan las 
siguientes: 1) son procedimientos de estimación por máxima verosimilitud (full likelihood), 2) 
son especialmente apropiados en el tratamiento de valores perdidos, 3) pueden manejar cova- 
riantes, tanto covariantes invariantes en el tiempo (que no cambian a lo largo del tiempo) como 
covariantes temporalmente variables (que cambian a lo largo del tiempo), 4) admiten variables 
dependientes numéricas y categóricas y 5) proporcionan estimaciones de los efectos específicos 
de sujeto para valorar el cambio inter e intraindividual (Arnau y Bono, 2008; Shek y Ma, 2011). 
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2. Una alternativa más simple es el ENFOQUE DE LOS MODELOS CON ECUACIONES DE ESTIMACIÓN GE- 
NERALIZADA (Generalized Estimating Equations), o más brevemente ENFOQUE GEE, un método 
desarrollado para modelos con estructura GLM que es especialmente apropiado para datos lon- 
gitudinales. El enfoque GEE fue originalmente desarrollado por Zeger y Liang (1986; véase tam- 
bién Zeger et al., 1988), se basa en un procedimiento de estimación semiparamétrico más simple, 
pero más robusto, basado en la cuasi-verosimilitud (partial likelihood) y tiene muchas similitu- 
des con el enfoque mixto (véase Vallejo, Fernández, Livacic-Rojas y Tuero, 2011b). Son en esencia 
modelos de regresión entre cuyas principales ventajas destacan las siguientes: 1) admite variables 
dependientes numéricas y categóricas, 2) emplea matrices de covarianza para modelar la no inde- 
pendencia entre las medidas, 3) acepta también covariantes invariantes o variantes en el tiempo, 
y 4) pueden tratar valores perdidos, pero el mayor inconveniente es que, a diferencia del enfoque 
mixto, no pueden manejar efectos aleatorios. 


3. La tercera alternativa es el ENFOQUE DE LOS MODELOS DE ECUACIONES ESTRUCTURALES (Structu- 
ral Equation Models), Oo ENFOQUE SEM, un enfoque desarrollado para modelos con estructura 
SEM cuyo principal exponente es la inclusión de variables no observables o latentes (que confi- 
guran un modelo de medida) y la prueba de modelos causales (mediante la especificación de un 
modelo estructural de las relaciones entre las variables). Los modelos SEM son hoy por hoy una 
herramienta extremadamente potente y versátil, con muchas ventajas sobre la metodología tra- 
dicional (que emplea sólo variables manifiestas), la más importante de las cuales es que permite 
responder no sólo a las mismas cuestiones tratadas por los procedimientos clásicos, sino también 
a cuestiones que no es posible plantear con tales procedimientos (Little, 2013; McArdle, 2009). 


Hay tres tipos de estudios comparativos prospectivos básicos (Bijleveld et al., 1998; Taris, 2000): 


— El más básico de todos es el diseño DISEÑO TRANSVERSAL SIMULTÁNEO (simultaneous cross-sectio- 
nal study) en el que varios grupos que difieren en alguna variable de naturaleza longitudinal se 
evalúan en una misma ocasión, permitiendo así su comparación en la/s VDs de interés. Aunque 
no tiene una orientación eminentemente prospectiva, ha sido y es muy útil como una herramienta 
exploratoria para probar hipótesis de naturaleza longitudinal. Por ejemplo, para estudiar la aso- 
ciación entre asistencia a centros de Educación Infantil (la VD) y rendimiento académico alo largo 
del periodo escolar, se puede utilizar una muestra de niños de primero y último curso de Prima- 
ria, y de primero y último curso de Secundaria en una ocasión única. La característica esencial de 
este diseño es que hay muestras de diferentes momentos evaluados en una única ocasión (en un 
mismo momento). La ventaja es que no se requiere demorar en el tiempo el registro de los datos, 
pero su desventaja es que no se pueden evaluar las diferencias intraindividuales (dentro de cada 
individuo). 


— La generalización del diseño transversal simultáneo a más de una ocasión constituye el DISEÑO 
TRANSVERSAL REPETIDO, también llamado DE TENDENCIA (trend study), que consta de al menos un 
diseño transversal simultáneo administrado en dos o más momentos en el tiempo. La característi- 
ca básica del diseño transversal repetido es que hay muestras de varios grupos de edad evaluados 
en más de una ocasión, y por tanto respecto del anterior tiene ya una orientación longitudinal. 
Por ejemplo, el mismo estudio anterior se puede realizar en 1990 y repetirlo después en 2000 y 
2010 para examinar si se mantiene la misma tendencia de resultados o se han producido cambios 
alo largo del tiempo. 
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— El diseño comparativo longitudinal por excelencia es el DISEÑO PROSPECTIVO, donde una muestra 
de individuos son evaluados en un conjunto de variables a lo largo de un número determinado 
de momentos temporales. En el mismo estudio anterior, el diseño prospectivo típico tomaría el 
grupo de individuos de primer curso de Primaria y prolongaría el estudio hasta que terminara 
el ciclo escolar. Los diseños prospectivos tienen muchas ventajas metodológicas respecto a los 
diseños transversal simultáneo y transversal repetido, pero son mucho más costosos en términos 
de economía y de tiempo requerido para su conclusión. 


DISEÑOS COMPARATIVOS PROSPECTIVOS 


Retrospectivo Transversal Prospectivo 
xx_—_—_—_—— _—_—_—+> 
tiempo : ahora : 


Grupos que difieren en el tiempo. Transversal simultáneo 
Se registra en una ocasión la/s VDs. o > O 


Comparación con sentido longitudinal.  : VD 
Estudio transversal simultáneo repetido E Transversal repetido 
Se registra en cada ocasión la/s VDs. : )(VD) (VIJ(VD) (VI) (VD : 
Una muestra de casos, uno o más E Medidas repetidas 
grupos, varias ocasiones de medida. h 


Similar al DMR intrasujeto o mixto. : VD VD WD... 


Se examinan los cambios en una cohorte: 


en el tiempo con muestras diferentes. Cohorte prospectivo 


Se registran longitudinalmente la/s VDs. ; ; VD VD VD R 
Grupos de casos/controles. : E ¡ 

Grupos anidados dentro de una cohorte. o AAA 

Se registran longitudinalmente la/s VDs. : 1 VD VD VD... : 


Figura 13.3. — Tipología de los diseños comparativos prospectivos. 


Dependiendo de la naturaleza de la muestra, del número de momentos temporales y del espaciado 
de los mismos pueden distinguirse varios tipos de diseños prospectivos (véase Arnau, 1995d): 


— El DISEÑO DE GRUPO CON MEDIDAS REPETIDAS utiliza una muestra de individuos a lo largo de una 
secuencia reducida de ocasiones (usualmente, entre 3 y 6) en un conjunto de variables. Es en mu- 
chos aspectos similar al DMR intrasujeto (véase capítulo 9), pero este diseño tiene naturaleza no 
experimental porque las medidas repetidas tienen sentido temporal y no hay ninguna variable 
manipulada, ni intervención o programa evaluable ni es posible una equilibración aleatoria de la 
secuencia temporal. El interés fundamental del diseño de grupo con medidas repetidas es carac- 
terizar el cambio a lo largo del tiempo. Como hemos tratado en los capítulos 9-10, para el análisis 
estadístico de los datos se recomienda emplear el enfoque mixto o el más simple pero efectivo en- 
foque GEE. Este diseño puede ampliarse también empleando dos o más grupos naturales, convir- 
tiéndolo en algo similar al DMR mixto o al diseño de parcela dividida (capítulo 10). En este caso, la 
forma de análisis estadístico más recomendable es una reformulación del enfoque multivariante 
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(MANOVA generalizado o GMANOV A), también llamado ANÁLISIS DE PERFILES (Potthof y Roy, 
1964), pero hoy más conocido como ANÁLISIS DE CURVAS DE CRECIMIENTO, que permite la estima- 
ción de la variabilidad entre individuos dentro de las pautas de cambio intraindividual a lo largo 
del tiempo (Hedeker, 2004). El análisis de curvas de crecimiento se plantea tres cuestiones en se- 
cuencia: 1) si las curvas de crecimiento para cada grupo son paralelas (evaluando la significación 
de la interacción gruposxmedidas), 2) en el caso de que sean paralelas, si los perfiles de grupo 
son iguales (evaluando la significación del factor intersujetos) y 3) en el caso de que los perfiles 
sean iguales, si el perfil global es nulo (evaluando la significación del factor intrasujeto), y después 
determina los componentes (p. ej., lineal, cuadrático, cúbico, etc.) de la curva. Los modelos de 
curva de crecimiento pueden definirse dentro la estructura GLMM (o sea, desde el enfoque mixto 
o multinivel, véase Steiger, 2009) o bien dentro de la estructura SEM (véase Duncan y Duncan, 
2004; Duncan, Duncan y Hops, 2010). 


Un ejemplo de diseño de grupo con medidas repetidas 

Objetivos. Casares-López et al. (2012) evaluaron la eficacia de una unidad libre de drogas intrapeni- 
tenciaria en la reducción del consumo de sustancias analizando los cambios en el perfil de la gravedad 
de la adicción, la motivación y el perfil de personalidad provocados por la intervención. 

Método. En el contexto de un diseño longitudinal, se evaluó a un grupo de 87 reclusos con diagnóstico 
de trastornos por abuso de sustancias (TUS) que participaron en un programa de la Unidad Terapeú- 
tica y Educativa del Centro penitenciario de Villabona (Asturias). El programa se prolongó durante un 
año, en cuyo transcurso se tomaron medidas en el momento de iniciar el tratamiento, y después en 
tres ocasiones: al mes (n = 67), a los 6 meses (n = 43) y alos 12 meses (n = 36). Para el análisis estadís- 
tico de los datos longitudinales, los autores aplicaron el enfoque multivariante y el enfoque mixto. 
Resultados. El programa consiguió disminuir el consumo de drogas y mejorar las áreas de consumo, 
de relaciones familiares y el perfil de personalidad, pero no se lograron cambios sustanciales en las 
áreas médica y psiquiátrica. A destacar la reducción al 41 % del número de casos inicial (N = 87) en la 
medida registrada a los 12 meses. 


En el DISEÑO PROSPECTIVO LONGITUDINAL, el diseño prospectivo por excelencia, una única mues- 
tra de sujetos se evalúa en un conjunto de variables a lo largo de un número mayor y más espa- 
ciado de momentos temporales. Los diseños prospectivos longitudinales tienen muchas ventajas 
metodológicas respecto alos diseños transversal simultáneo y transversal repetido, pero son mu- 
cho más costosos en términos de economía y tiempo requerido para su conclusión. 


Un ejemplo de diseño de prospectivo longitudinal. 

Objetivos. Una investigación de Lansford et al. (2002) se planteó si el maltrato físico infantil temprano 
tiene efectos a largo plazo en la aparición de problemas psicológicos, conductuales y académicos, 
independientemente de otros efectos asociados al maltrato. 

Método. Un diseño prospectivo longitudinal recogió datos anuales durante un periodo de 12 años 
(desde 1987 a 1999) sobre una muestra de 585 niños de tres localidades geográficas antes de su ingreso 
en guarderías. En la medida inicial, el 11.8% de los niños de la muestra habían experimentado maltrato 
físico. Al final del estudio se lograron datos completos del 71% de la muestra inicial. 

Resultados. Los niños con antecedentes de maltrato faltaron más a clase y tenían niveles de agresión, 
ansiedad /depresión, disociación, trastorno de estrés postraumático, problemas sociales y problemas 
cognitivos superiores a los niños sin antecedentes. Estos resultados se mantuvieron después de con- 
trolar algunas variables familiares y personales correlacionadas con el maltrato. 
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— En Ciencias de la Salud es más común una forma de diseño prospectivo denominada DISEÑO DE 
COHORTE PROSPECTIVO, cuya metodología es similar al diseño de cohorte retrospectivo, pero la 
cohorte es evaluada hacia adelante, en varios momentos a lo largo del tiempo, utilizando una 
o más VDs relevantes (p. ej., las dimensiones de una escala de personalidad). Usualmente este 
diseño incluye una única cohorte y se prolonga en el tiempo hasta determinar el resultado de 
interés (p. ej., la incidencia de la depresión), en cuyo caso los miembros de la cohorte que no 
desarrollan depresión sirven como controles internos. Pero también puede incluir más de una 
cohorte, un grupo expuesto y otro no expuesto, en cuyo caso este último grupo sirve como control 
externo, mejorando así sensiblemente la validez del diseño (Mann, 2003). Ejemplos de uso de este 
diseño pueden consultarse en Fiscella y Franks (1997), Kelleher et al. (2013) y Lansford et al. (2007). 


— Un diseño prospectivo con estructura similar al diseño retrospectivo caso-control es el DISEÑO 
CASO-CONTROL ANIDADO, en el que una muestra de casos y controles se seleccionan desde den- 
tro de una cohorte bien definida (donde es accesible la información de todos sus miembros) en 
el marco de un estudio de cohorte prospectivo, permitiendo reducir sensiblemente el tiempo y 
el coste económico en comparación con el diseño caso-control (véase Ernster, 1994). En general, 
los controles suelen ser más numerosos que los casos (se aconseja una relación de 4 controles por 
caso) y emparejados en una o más variables relevantes. Como consecuencia del proceso de mues- 
treo desde dentro de la cohorte, los problemas derivados del diseño caso-control se alivian sen- 
siblemente en el diseño caso-control anidado. Un diseño similar al diseño caso-control anidado 
es el DISEÑO CASO-COHORTE (véase Prentice, 1986), que difiere de aquél porque el procedimiento 
de muestreo de los controles desde dentro de la cohorte es aleatorio. Ejemplos recientes de uso 
del diseño caso-control anidado pueden consultarse en sendos trabajos de Christiansen y Larsen 
(2012), Toledo, López, Donazar, Navarro y Martínez (2011) y de Webb et al (2012). 


Un ejemplo de diseño caso-control anidado 

Objetivos. Christiansen y Larsen (2012) intentaron someter a prueba lo que la literatura psiquiátrica 
ha apuntado en repetidas ocasiones, a saber, que después de asistir a una consulta psiquiátrica, se 
incrementa el riesgo de intento de suicidio en niños y adolescentes que viven en el seno de familias 
con bajo estatus socioeconómico. 

Método. Con esta finalidad se extrajeron de los datos de archivos daneses información sobre los indivi- 
duos nacidos en el periodo 1983-1989. De los 403431 individuos con registros válidos que constituyó 
la cohorte del estudio, 3465 que habían intentado suicidarse formaron el grupo de casos, cada uno 
de los cuales se emparejó con 20 controles en sexo y edad con el objeto de controlar sus efectos. Se 
empleó un diseño caso-control anidado con una muestra total de 72765 individuos para analizar el 
riesgo de suicidio después de visitar al psiquiatra. Los individuos en riesgo de suicidio habían sido 
clasificados en varias categorías diagnósticas y habían recibido tratamiento psicofarmacológico antes 
de su intento de suicidio. 

Resultados. Los resultados fueron analizados con regresión logística y permitieron demostrar que el 
riesgo de suicidio alcanzaba un pico inmediatamente después de visitar al psiquiatra y era mayor 
en individuos que tienen trastornos de personalidad, depresión y consumo de drogas y, en menor 
medida, también en individuos con ingresos familiares en el tercio superior. 


Otras formas de estudio prospectivo ocasionalmente usadas en Psicología son el diseño prospectivo 
longitudinal en panel, que es común en algunas aplicaciones sociales, que tiene pocas ocasiones de 
medida (menos de 8) separadas como mínimo seis meses, y el diseño prospectivo longitudinal intensivo, 
que tiene muchas ocasiones de medida (20 o más) registradas en largos intervalos (Collins, 2006). 
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13.2.4. Estudios evolutivos 


Los estudios comparativos se han interesado tradicionalmente por analizar las diferencias que se 
producen en comportamientos o habilidades de interés en función de la edad o el desarrollo bien sea 
entre etapas evolutivas o a lo largo del ciclo vital. Es muy importante determinar si el interés de una 
investigación son las diferencias entre momentos de medida (p. ej., la edad), que pueden tratarse con 
diseños transversales simultáneos comparando grupos de personas que difieren en edad pero son eva- 
luados en un mismo momento, o son los cambios debidos a la edad o al desarrollo, que se tratan con 
diseños prospectivos observando a los mismos individuos en dos o más momentos diferentes (Schaie y 
Caskie, 2006). 

Un ESTUDIO EVOLUTIVO es una de las formas que pueden tomar los estudios comparativos donde el 
interés es la evaluación de los cambios debidos a la edad o el desarrollo durante un periodo de tiempo 
relativamente prolongado, empleando en general niños como unidades experimentales primarias en un 
ciclo de desarrollo y uno de tres procedimientos de evaluación, dependiendo de su naturaleza temporal: 
transversal, longitudinal o secuencial. Los tres diseños evolutivos pertenececientes a esta tradición clá- 
sica (Baltes, Reese y Nesselroade, 1977; Schaie, 1965; Rosel, 1995) se describen a continuación. La figura 
13.4 ofrece una representación simplificada de los mismos. 


Transversal (cross-sectional) Longitudinal 

Cohorte Edades Cohorte Edades 

1975 15 16 17 18 19 20 21 22 1975 15 16 17 18 19 20 21 22 
1976 14 15 16 17 18 19 20 21 1976 14 15 16 17 18 19 20 21 
1977 13 14 15 16 17 18 19 20 1977 13 _14 15 16__17 18 19 20 
1978 12 13 14 15 16 17 18 19 1978 Ta 13 14 15 16 17 18 19 | 
1979 11 12 13 14 15 16 17 18 1979 ATT py 11 15 16 17 LUN 
1980 10 11 12 13 14 15 16 17 1980 10 11 12 13 14 15 16 17 
1981 9 10 1 12 13 14 15 16 1981 9 10 11 12 13 14 15 16 
1982 8 9 10 11 12 13 14 15 1982 8 9 10 11 12 13 14 15 
1983 7 8 9 10 11 12 13 14 1983 Ll 8 9 10 1 12 13 14 
1984 6 7 8 9 10 11 12 13 1984 6 7 8 9 10 11 12 13 
1985 5 6 7 8 9 10 1 12 1985 5 6 7 8 9 10 1 12 
Medida 1990 1991 1992 1993 199 1995 1996 1997 Medida 1990 1991 1992 1993 199% 1995 1996 1997 


Cohorte Edades 
1975 
1976 
1977 
1978 
1979 
1980 
1981 
1982 
1983 
1984 
1985 
Medida 1990 1991 1992 1993 1994 1995 1996 1997 


Figura 13.4. — Tipología de los diseños evolutivos básicos. 
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— El DISEÑO EVOLUTIVO TRANSVERSAL (cross-sectional developmental design) utiliza muestras de di- 
ferentes grupos de edad evaluados mediante comparaciones intersujetos en un mismo momento 
temporal (en la figura 13.4, grupos de 6 a 16 años de edad medidos en 1991) y persigue como obje- 
tivo encontrar diferencias en función de la edad en la medida de una o más variables de respuesta. 
Este diseño es equivalente al DISEÑO TRANSVERSAL SIMULTÁNEO. La dimensión longitudinal en es- 
te diseño se debe a la comparación entre diferentes grupos de edad. La característica diferencial 
que justifica su inclusión en los estudios evolutivos es que la variable primaria es la edad, mien- 
tras que en los estudios comparativos transversales y en el diseño transversal simultáneo la edad 
suele ser una variable secundaria o de control (Taris, 2000). El diseño es eficiente, porque permite 
aproximar un estudio longitudinal desde una perspectiva transversal, pero no es posible evaluar el 
cambio intraindividual y los efectos de edad se confunden con los efectos de cohorte. Un ejemplo 
de este diseño puede consultarse en Gaultney (1998). 


— El DISEÑO EVOLUTIVO LONGITUDINAL (longitudinal developmental design) se interesa por el aná- 
lisis del cambio que se produce en un grupo de individuos observado en repetidas ocasiones a lo 
largo del tiempo (en la figura 13.4, un grupo de niños es evaluado desde los 12 alos 19 años). Este 
diseño es equivalente al diseño prospectivo longitudinal, pero el interés esencial son los cambios 
debidos a la edad o al desarrollo. Aunque el diseño es válido para evaluar el cambio intraindivi- 
dual, su problema esencial, en relación con el diseño evolutivo transversal, es el coste temporal y 
económico que supone. Un ejemplo de este diseño se puede consultar en Díaz y Pérez (2003). 


Un ejemplo de diseño evolutivo longitudinal 


Objetivos. Landa, Gross, Stuart y Faherty (2013) se interesaron por los trastornos del espectro autista 
(TEA), un conjunto de trastornos neuroevolutivos que se caracterizan por el daño en reciprocidad 
y comunicación social, junto con la manifestación de ciertas pautas repetitivas y estereotipadas de 
conducta, y fue originalmente definido como un trastorno congénito, pero algunos estudios retros- 
pectivos han demostrado que suelen presentarse o bien de forma temprana o bien después de un 
periodo de desarrollo relativamente saludable. 

Método. Este trabajo empleó un diseño evolutivo longitudinal con el objetivo de examinar las trayec- 
torias sociales, lingúisticas y motoras de 235 niños con y sin un hermano autista en un periodo com- 
prendido desde los 6 a los 36 meses. Se formaron tres grupos: 1) TEA identificado tempranamente (28 
niños), 2) TEA identificado tardíamente (26 niños) y 3) no TEA (181 niños). Como medidas depen- 
dientes se utilizó la escala de observación diagnóstica de autismo (ADOS) y la escala de aprendizaje 
temprano de Mullen (ELC). Con el objetivo de describir las curvas de crecimiento específicas de grupo 
e identificar diferencias entre los grupos diagnósticos para cada edad y para su desarrollo hasta los 3 
años, los autores analizaron los datos mediante el enfoque GEE. 

Resultados. Pese a comenzar con un nivel evolutivo similar a los 6 meses, los grupos exhibieron curvas 
de crecimiento atípicas en su desarrollo, encontrándose diferencias notables entre los grupos 1) y 2) 
entre los 14 y los 24 meses, pero las diferencias desaparecieron a los 36 meses. 


— En el DISEÑO EVOLUTIVO DE RETARDO TEMPORAL (developmental time-lag design) se registran ob- 
servaciones en diferentes momentos temporales, como en el diseño longitudinal, pero se utiliza 
una muestra de individuos del mismo grupo de edad que es diferente para cada momento tem- 
poral. Este diseño combina las ventajas de los dos anteriores, limitando el coste temporal y mini- 
mizando los supuestos evolutivos, pero resulta muy poco utilizado. 
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Estos tres diseños son casos especiales del MODELO EVOLUTIVO GENERAL DE SCHAIE (1965), quien postuló 
que cualquier cambio evolutivo puede ser potencialmente descompuesto en una (o más) de tres dimen- 
siones independientes de edad cronológica (referida al número de años desde el nacimiento al momento 
cronológico en que se evalúa el comportamiento), cohorte o generación (referida al grupo de individuos 
que participan de un contexto común en un mismo momento cronológico) y periodo (referida a la oca- 
sión temporal en que se realiza la medida). Las tres dimensiones se confunden de forma que, una vez 
especificadas dos de ellas, la tercera viene determinada. Por ejemplo, un individuo de una cohorte na- 
cida en 1950 y evaluada en el periodo 1990 se sabe que tiene una edad de 40 años en el momento de la 
medida. Así, en el diseño evolutivo transversal, edad y cohorte se confunden y por tanto no pueden ob- 
servarse efectos debidos al periodo, ya que los grupos de edad estudiados deben pertenecer a diferentes 
cohortes. En el diseño evolutivo longitudinal se confunden edad y periodo y por tanto no pueden obser- 
varse efectos debidos a la cohorte. Por su parte, en el diseño evolutivo de retardo temporal se confunden 
los efectos de periodo y cohorte (Schaie, 1994; Schaie y Caskie, 2006). 

Sin embargo, imponiendo restricciones apropiadas sobre una de las tres dimensiones del mode- 
lo, es posible analizar los otros dos componentes y su interacción (Arnau, 1995d; Bijleveld et al., 1999; 
Masche y van Dulmen, 2004; Menard, 2008). Varias estrategias se han propuesto para analizar todas las 
combinaciones de dos de los tres componentes, produciendo tres nuevos tipos de diseño que se cono- 
cen Como DISEÑOS SECUENCIALES (sequential designs, véase Schaie, 1994; Schaie y Caskie, 2006), y se 
han representado en la figura 13.5. Siguiendo a Little (2013, p.38), son en concreto los siguientes: 


1. el DISEÑO SECUENCIAL DE TIEMPO (time-sequential design), que es un diseño transversal repetido 
con algunos participantes seguidos longitudinamente, 


2. el DISEÑO SECUENCIAL DE COHORTE (cohort sequential design,), que emplea varias cohortes, cada 
una de las cuales comienza a una edad diferente y después sigue longitudinalmente a los partici- 
pantes, y 


3. el DISEÑO SECUENCIAL TRANSVERSO (cross-sequential design), que es un diseño transversal simul- 
táneo que sigue longitudinalmente a todos los participantes. 


Un ejemplo de diseño secuencial transverso 


Objetivos. En una investigación de Krampen (2012) se analizó el desarrollo de la creatividad en niños 
que atendían a diferentes sistemas escolares. 

Método. Una serie de pruebas de creatividad libres de influencia cultural e inteligencia, se administró 
a 5 cohortes, 2 cohortes de jardín de infancia (que se corresponden con el primer ciclo de educación 
infantil) y 3 cohortes de los tres primeros años de educación elemental (que se corresponden con 
el segundo ciclo de educación infantil). Todos los niños fueron evaluados de nuevo a lo largo de los 
tres años siguientes. Las muestras utilizadas incluían 244 niños de Luxemburgo y 312 niños alemanes 
que o bien asistían a un sistema educativo con jardín de infancia obligatorio y 6 años de enseñanza 
elemental obligatoria, o bien a un sistema con jardín de infancia no obligatoria y 4 años de enseñanza 
elemental obligatoria. Ambas muestras fueron analizadas por separado. 

Resultados. Los resultados demostraron la existencia de: (1) un incremento lineal en inteligencia con 
la edad en ambas muestras, (2) una disminución del rendimiento divergente después de terminar el 
ciclo escolar en ambas muestras, (3) un incremento en el rendimiento divergente hasta el quinto año 
de escuela elemental en Luxemburgo y hasta el tercer año en Alemania. Los resultados de la aplica- 
ción del diseño secuencial transverso confirmaron la existencia de una discontinuidad general en el 
desarrollo del rendimiento divergente en la infancia. 


OEdiciones Pirámide 


Diseños no experimentales 493 


Los diseños evolutivos secuenciales son más eficientes que los diseños evolutivos clásicos en tér- 
minos de tiempo y coste económico. Por ejemplo, un diseño evolutivo longitudinal con niños de 5a 
13 años observados cada año requiere para ser completado 8 años, mientras que un diseño secuencial 
equivalente reduce a la mitad el tiempo requerido para realizar el estudio, utilizando por ejemplo un 
grupo de niños de 5 años (que se observa a los 5, 7 y 9 años) y otro grupo de niños de 9 años (que se 
observa alos 9, 11 y 13 años). Esta reducción en el tiempo requerido para completar el proceso de inves- 
tigación justifica el empleo de DISEÑOS LONGITUDINALES ACELERADOS (véase Duncan, Duncan y Hops, 
1996; Little, 2013) con el que se conoce también a los diseños evolutivos secuenciales. 


Secuencial de tiempo Secuencial de cohorte 
(time-sequential) (cohort-sequential) 

Cohorte Edades Cohorte Edades 

1975 17 18 19 20 21 22 1975 

1976 16 20 21 1976 

1977 19 20 1977 

1978 18 19 1978 

1979 17 18 1979 

1980 16 17 1980 

1981 15 16 1981 

1982 14 15 1982 

1983 13 14 1983 

1984 12 13 1984 

1985 11 12 1985 

Medida 996 1997 Medida 1990 1991 1992 1993 1994 1995 1996 1997 


Secuencial transverso 
(cross-sequential) 


Cohorte Edades 
1975 
1976 
1977 
1978 
1979 
1980 
1981 
1982 
1983 
1984 
1985 


Figura 13.5. — Tipología de los diseños secuenciales. 


13.3. ESTUDIOS PREDICTIVOS Y EXPLICATIVOS 


Otro tipo de investigaciones no experimentales que derivan de la estrategia asociativa son los estu- 
dios cuyo propósito principal es explorar las relaciones entre variables con el objeto de pronosticar o 
explicar su comportamiento. Obviamente, el sentido del término 'explicativo' no se entiende como una 
explicación causal, sino como una descomposición y asignación rigurosa de la variación existente a las 
variables (observables y no observables) analizadas. Durante mucho tiempo se han conocido también 
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con el nombre genérico de DISEÑOS CORRELACIONALES, pero esta denominación se ha considerado in- 
correcta porque el tipo de análisis estadístico no es precisamente el tema crucial en este tipo de estudios 
(Shadish et al., 2002, p. 18). Sin embargo, esta precisión se realizó para una amplia gama de diseños no 
experimentales. Para los estudios que únicamente exploran relaciones entre variables con coeficientes 
de correlación simple o múltiple seguiremos empleando la denominación de correlacional en este texto. 

Tres características distintivas permiten definir operativamente este tipo de estudios de la estrategia 
asociativa respecto de los estudios comparativos: 


— a) la existencia de una muestra única de participantes que en general no es seleccionada aleato- 
riamente de la población (si existiera un proceso de selección rigurosa de la población con una 
muestra numerosa con el objeto de ser representativa de la población, el estudio debería clasifi- 
carse como estudio de encuesta); 


— b) la medida de cada participante de la muestra en dos o más variables de naturaleza cuantitativa, 
aunque ocasionalmente las mediciones realizadas también pueden ser de naturaleza categórica; 


— C) la disponibilidad, como punto de partida para abordar el análisis estadístico, de una matriz de 
correlación (o de covarianza) entre las variables implicadas. 


Siguiendo a Pedhazur y Smelkin (1991) los hemos clasificado, dependiendo de la complejidad del obje- 
tivo que se persigue, en estudios predictivos y explicativos. Se representan en la figura 13.6. 


OTROS DISEÑOS NO EXPERIMENTALES 
PREDICTIVOS EXPLICATIVOS 
Diseño correlacional simple 
Una muestra de casos. 
Pp No hay distinción entre variables. E Diseño con variables observables 
R No se usan técnicas de control. X ] 
Análisis de correlación simple/múltiple. _.. Una o más muestra/s de casos, 
E Diseñ onaleonakd Pp Distingue variables endógenas y exógenas. 
¡Seno coneleciónal comtrolado Solo incluye variables observables. 
D Una muestra de casos. L Requiere modelos path. 
No hay distinción entre variables. Se analiza sólo el submodelo estructural. 
| Se usan técnicas de control. 
C Análisis de correlación parcial y semiparcial. (6 
T Diseño predictivo simple A 
Una muestra de casos. E A A 
| Distingue predictor/es y criterio. Diseño con variables latentes 
V No se usan técnicas de control. l Una o más muestra/s de casos. 
Análisis de regresión simple/múltiple. Distingue variables endógenas y exógenas. 
0 V Incluye variables observables y latentes. 
S Diseño predictivo controlado lo) A do des ai | 
Una muestra de casos. e analizan los dos submodelos 
Distingue predictor/es y criterio. S (estructural y de medida). 
Se usan técnicas de control. 
Análisis de regresión jerárquica y multinivel. 
lesa 


Figura 13.6. — Tipología de los estudios predictivos y explicativos. 
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13.3.1. Estudios predictivos 


La forma más básica que suele adoptar este tipo de estudios ocurre cuando el objetivo de la investi- 
gación es simplemente explorar una relación funcional entre dos o más variables, sin distinción alguna 
entre ellas. Puesto que no se utiliza ninguna forma de control de variables extrañas sobre la relación 
funcional, el diseño resultante se denomina DISEÑO CORRELACIONAL SIMPLE. Para el análisis estadístico 
de la asociación entre variables suele utilizarse algún coeficiente de correlación (o una matriz de coefi- 
cientes de correlación) apropiado a la naturaleza métrica de las variables (p. ej., Sicilia, Aguila, Muyor, 
Orta y Moreno, 2009), pero también son posibles otras técnicas analíticas alternativas. 

Resulta obvio que en el diseño correlacional simple el grado de control ejercido sobre las terceras 
variables que potencialmente pueden afectar a la relación analizada es nulo y que todas las variables tie- 
nen el mismo estatus metodológico (en realidad, todas se consideran variables criterio), por lo que este 
diseño es altamente propenso a padecer muchas de las amenazas contra la validez interna y externa. 
Puede mejorarse sensiblemente cuando la relación funcional entre las variables se explora controlando 
una (o más) tercera(s) variable(s). El procedimiento de control más apropiado en este caso es el control 
estadístico mediante residualización o parcialización, en cuyo caso el diseño resultante se denomina 
DISEÑO CORRELACIONAL CONTROLADO. El análisis estadístico suele utilizar coeficientes de correlación 
parcial o semiparcial de orden k, donde k se refiere al número de variables controladas, pero también 
técnicas de ajuste estadístico tales como ANCOVA o MANCOVA (ANCOVA multivariante). 


Cuando el objetivo de la investigación es explorar una relación funcional mediante el pronóstico 
de alguna variable criterio a partir de uno o más predictores, se aplica un DISEÑO PREDICTIVO SIMPLE, 
donde es común la utilización de los términos predictor, en sustitución del de variable independiente, 
y criterio, en sustitución del de variable dependiente. El procedimiento estadístico más común consiste 
en especificar un modelo de regresión apropiado, lineal o no lineal, dependiendo de la naturaleza y la 
distribución de la/s variable/s criterio. Cuando la variable criterio es numérica y distribuida normal- 
mente, suele especificarse un modelo de regresión normal (p. ej., Jiménez, Martínez, Miró y Sánchez, 
2012), cuando la variable es binaria o dicotómica un modelo de regresión logística (p. ej., Planes, Prat, 
Gómez, Grass y Font-Mayolas, 2012) y cuando se trata de una variable de recuento un modelo de regre- 
sión de Poisson (p. ej., Palmer, Llorens y Perelló, 2005). 


Un ejemplo de diseño correlacional controlado 


Objetivos. En una investigación de Patró, Corbalán y Limiñana (2007) se planificó analizar la contribu- 
ción de diversas variables de personalidad sobre el impacto psicológico de la experiencia de maltrato, 
así como identificar los estilos de personalidad que se asocian a un mayor o menor nivel de sintoma- 
tología depresiva. 

Método. Se empleó el diseño correlacional controlado con una muestra de 105 mujeres víctimas de 
maltrato por parte de su pareja y residentes en centros de acogida. Como medida de respuesta se 
administró el Inventario de Estilos de Personalidad de Millon (MIPS, Millon, 1994), junto con medidas 
referidas a la situación de violencia sufrida, estresores adicionales y apoyo social. El análisis estadístico 
recurrió a coeficientes de correlación simple y correlación parcial de primer orden para conocer la 
relación neta de las variables de personalidad con el nivel de sintomatología depresiva. 

Resultados. El nivel de síntomas evaluados presentaba correlaciones parciales significativas con las es- 
calas del MIPS, una vez controlado el efecto de las variables contextuales y de la situación de maltrato, 
comprobando su influencia en el impacto psicológico de la experiencia de maltrato. 
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Un ejemplo de diseño predictivo simple 


Objetivos. Sora, González-Morales, Caballer y Peiró (2011) desarrollaron una investigación con dos 
objetivos: 1) confirmar la evidencia empírica sobre la asociación entre la inseguridad laboral, como 
un importante estresor laboral, y sus efectos individuales sobre los empleados (en las variables de 
respuesta satisfacción laboral, salud psicológica e intención de abandono del trabajo), y 2) valorar el 
papel modulador del apoyo organizacional en esta relación. 

Método. Se utilizó un total de 859 empleados de 42 organizaciones pertenecientes a 3 sectores labora- 
les (educación, alimentación y ventas). Para el análisis estadístico se recurrió al análisis de moderación 
mediante regresión múltiple y al análisis de regresión multinivel. 

Resultados. En respuesta al primer objetivo, el análisis multinivel demostró una asociación significa- 
tiva entre inseguridad laboral y las variables de respuesta. En respuesta al segundo objetivo, mediante 
un análisis de moderación se demostró también que el apoyo organizacional modulaba la relación 
entre inseguridad laboral y las variables de respuesta. 


Siempre que se aplican los diseños predictivos es también posible, e incluso en ocasiones conve- 
niente, evaluar la eficacia de la predicción mediante una clasificación de los participantes. Es útil en 
este contexto, además de la regresión logística, la aplicación de otras técnicas multivariantes tales como 
el análisis discriminante, la clasificación y segmentación jerárquicas y las redes neurales (véase Hair, 
Black, Babin y Anderson, 2009; Levy y Varela, 2003). 

En algunos diseños predictivos simples pueden emplearse procedimientos de control de variables 
extrañas. El resultado es el DISEÑO PREDICTIVO CONTROLADO. Procedimientos analíticos muy recomen- 
dables en este contexto son los modelos de regresión jerárquica (Cohen et al., 2003) que en un formato 
de selección por etapas permiten evaluar el efecto de un conjunto de variables de interés en segundas 
o ulteriores etapas, una vez depuradas del impacto de variables de control introducidas en las primeras 
etapas, como se trató en el capítulo 2 (p. ej., Rosário et al., 2012). Si los datos están organizados de forma 
jerárquica ('clustered data”) la opción más recomendable son los modelos de regresión multinivel (p. ej., 
Núñez et al., 2014). 


Un ejemplo de diseño predictivo controlado 


Objetivos. Las quejas somáticas constituyen un problema frecuente en adolescentes, aunque sólo en 
algunos casos es posible encontrar una causa médica clara. Por ello, existe una atención creciente ha- 
cia los factores psicológicos que podrían estar relacionados. Dos áreas del funcionamiento emocional 
son los principales referentes a este respecto: estados de ánimo negativos y conciencia emocional. En 
un trabajo publicado por Rieffe, Villanueva, Adrián y Górriz (2009) se analizó si la conciencia emocio- 
nal contribuía a la predicción de las quejas somáticas, independientemente del estado de ánimo. 
Método. Los participantes en este estudio, 441 adolescentes entre los 13 y los 15 años de edad, cum- 
plimentaron cuestionarios de autoinforme sobre quejas somáticas, estados de ánimo y conciencia 
emocional. Los datos empíricos fueron tratados con análisis de correlación y regresión jerárquica. 
Resultados. Se confirmó que la conciencia emocional presentaba una limitada contribución en la pre- 
dicción de quejas somáticas. Esta contribución estaba moderada por los estados de ánimo, a excep- 
ción de dos aspectos específicos de la conciencia emocional: conciencia corporal de las emociones y 
predisposición a tener en cuenta las emociones de los demás. Estos resultados refuerzan la hipótesis 
de que la conciencia emocional precede a los estados de ánimo, los cuales, a su vez, poseen un efecto 
en la percepción que los jóvenes tienen sobre su salud. 
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13.3.2. Estudios explicativos 


Otro tipo de investigaciones que derivan de la estrategia asociativa son los ESTUDIOS EXPLICATIVOS, 
que se proponen con el objetivo de probar modelos acerca de las relaciones existentes entre un conjun- 
to de variables, tal y como se derivan de una teoría subyacente. En un modelo de regresión, el modelo 
estadístico básico de los estudios predictivos, se definen con claridad los papeles de predictor y criterio, 
pero postulan estructuras de modelado muy simples (por lo general, un criterio y varios predictores) y 
consideran todas las variables como manifiestas u observables y medidas sin error, lo que limita consi- 
derablemente su aplicabilidad. Su generalización a modelos más avanzados, incluyendo estructuras de 
modelado simultáneas y variables no observables o latentes, permiten definir un sistema de ecuaciones 
de regresión donde las variables pueden intercambiar sus papeles de predictor y criterio. Para aclarar 
en mayor medida su función en el contexto de cada una de las ecuaciones de regresión del sistema se 
utilizan alternativamente los términos de variables exógenas (ajenas al sistema) y variables endógenas 
(internas al sistema), en lugar de los términos de predictor y criterio. 

Dos situaciones de investigación se contemplan aquí, dependiendo de que los modelos incluyan 
sólo variables manifiestas (observables) o variables manifiestas y latentes (no observables). 


— En primer lugar, el DISEÑO CON VARIABLES OBSERVABLES O MODELO PATH, que se caracteriza por 
definir una red estructural de relaciones entre variables que puede representarse mediante un 
sistema de ecuaciones de regresión, asumiendo que todas las variables son manifiestas. El proce- 
dimiento estadístico más apropiado para analizar los datos de este tipo de diseño parte también, 
como los estudios predictivos, de una matriz de correlaciones (o covarianzas) y aplica después 
el análisis de rutas (path analysis). El ajuste de los datos empíricos al modelo propuesto se eva- 
lúa utilizando medidas de ajuste apropiadas para modelos estructurales (véase Kline, 2011). Sin 
embargo, como se apuntó más arriba, los investigadores deben tener siempre presente que este 
análisis asume que las variables observables son manifestaciones fiables de sus correspondientes 
constructos, lo que no siempre se puede justificar (véase Cole y Preacher, 2014). 


Dada una relación funcional entre un predictor y un criterio, una de las más interesantes propie- 
dades del diseño con variables observables es su potencial para investigar los efectos de una o 
más terceras variables (Ato y Vallejo, 2011), lo que justifica el incremento sensible de investigacio- 
nes que someten a prueba modelos de mediación y moderación (Jose, 2013, Hayes, 2013). Como 
tratamos en el capítulo 2, en su forma más simple, un modelo de mediación se interesa por los 
procesos intervinientes que producen una relación funcional o un efecto de tratamiento (p. ej., 
Gartzia, Aritzeta, Balluerka y Barberá, 2012), mientras que un modelo de moderación se interesa 
por los procesos que afectan a la magnitud de la relación o efecto (p. ej., Rodrigo, Molina, García- 
Ros y Pérez-González, 2012). La reformulación de los modelos de mediación y moderación con 
modelos *path', en lugar de modelos de regresión múltiple, abre nuevas e interesantes perspecti- 
vas analíticas (Holmbeck, 1997). 


— En segundo lugar, el DISEÑO EXPLICATIVO CON VARIABLES LATENTES, O MODELO SEM distingue en 
un modelo una parte estructural (que representa un submodelo estructural de relaciones entre 
variables, como en el diseño con variables observables) y una parte de medida (que incluye los 
diferentes indicadores que definen cada uno de los constructos o variables latentes, lo que en su 
conjunto representa un submodelo de medida). El modelo SEM se representa también median- 
te un sistema de ecuaciones estructurales, donde algunas variables son observables y otras son 
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latentes. Por tal razón se conocen también como modelos de ecuaciones estructurales (structural 
equation models”) o modelos de estructuras de covarianza (covariance structural models). 


Un ejemplo de diseño explicativo con variables observables 


Objetivos. Pozo, Sarriá y Méndez (2006) analizaron el estrés maternal en familias de personas con tras- 
tornos del espectro autista (TEA) proponiendo un modelo multifactorial y global basado en el modelo 
teórico de estrés familiar Doble ABCX, donde la variable A (estresor) en interacción con B (apoyos) y 
C (sentido de la coherencia, SOC) produce como resultado X (nivel de estrés). 

Método. 39 madres con hijos diagnosticados con TEA completaron cuatro cuestionarios referidos a 
las variables básicas ABCX. Para el análisis estadístico de los datos empíricos se empleó análisis path 
y se sometió a prueba el modelo teórico de estrés familiar que se muestra en la figura 13.6, donde 
los rectángulos representan variables observables, e; representan los errores del modelo y sobre ca- 
da flecha se expresa el coeficiente de regresión no estandarizado tomando como criterio la variable 
colocada en la punta de la flecha. 

Resultados. Los datos empíricos presentaron un ajuste global satisfactorio con el modelo teórico 
Mm = 0.114; P = .735). Los autores concluyeron que hay una relación directa y positiva entre estre- 
sor (A) y estrés, mientras que las variables apoyo (B) y sentido de la coherencia (C) tenían una relación 
directa y negativa con el estrés (X), actuando como variables mediadoras. 


Chi-squared = ,114 
df=1 
p=.,735 


2 » 5 
— Estresor + | Estrés total | «———— 
conglomerado 9 


2 
26 29, 


Figura 13.7. — Modelo explicativo probado en el trabajo de Pozo, Sarriá y Méndez (2006). 


Aunque todavía es un tema controvertido, pueden considerarse al menos dos enfoques estadísticos ge- 
nerales apropiados para estimar los parámetros de los modelos SEM, en concreto: 


— un procedimiento basado en las covarianzas (covariance-based SEM), que es el más extendido 
(Batista y Coenders, 2012; Kline, 2011; Levy y Varela, 2006), para el que se han diseñado programas 
de análisis específicos (entre otros, AMOS, EQS, LISREL, MPLUS, los paquetes SEM y GSEM 
del programa STATA y los paquetes SEM y LAVAAN, del programa R). 
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— un procedimiento basado en las varianzas (variance-based SEM), denominado partial least squa- 
res path modeling (PLS— PM), que suele aplicarse cuando no se cumplen las severas condiciones 
que exige el primero, en particular las relativas al tamaño muestral, normalidad multivariante e 
independencia de las observaciones (Vinzi, Chin, Henseler y Wang, 2010; Hair, Hult, Ringle y Sars- 
tedt, 2013), y para el que también existen programas de análisis apropiados como el programa 
PLS-— PM, que se incluye también en el paquete R (Sánchez, 2013). Son recientes las aplicaciones 
con este tipo de modelos publicadas en psicología (p. ej., Carranza, González-Salinas y Ato, 2013). 


Un ejemplo de diseño explicativo con variables latentes 


Objetivos. Un trabajo de Calvete, Estévez y Corral (2007) evaluó la asociación entre síntomas del Tras- 
torno por Estrés Postraumático (TEP) y los esquemas cognitivos disfuncionales en víctimas de violen- 
cia por parte de la pareja. 

Método. En el estudio participaron 114 mujeres atendidas por servicios especializados para víctimas, 
a quienes se administraron medidas de agresión física, abuso sexual, abuso psicológico, TEP y es- 
quemas cognitivos. Mediante un diseño explicativo con variables latentes se sometió a prueba si los 
síntomas de estrés postraumático mediaban la asociación entre violencia y esquemas cognitivos. El 
modelo teórico probado, que se muestra en la figura 13.8, postuló cuatro constructos latentes (repre- 
sentados con elipses): "Violencia' (con 3 variables observables, representadas con rectángulos: física, 
psicológica y social), como predictor, "Estrés postraumático”, como mediador, y "Desconexión y recha- 
zo' y 'Autonomía deteriorada' (cada uno con 2 variables observables), como variables de respuesta. 
Resultados. El ajuste global absoluto del modelo fue aceptable: q?(21) = 31.62; P = .064, y todos los 
parámetros del modelo de mediación fueron estadísticamente significativos, demostrando que la aso- 
ciación entre violencia y esquemas cognitivos está totalmente mediada por la presencia de síntomas 
de TEP. La figura 13.8 (Calvete et al., 2007, p. 449) muestra el modelo estructural sometido a prueba. 
Los valores numéricos muestran los coeficientes de regresión no estandarizados del modelo. 

Los resultados mostraron que el 67.5% de las mujeres cumplían criterios para el diagnóstico de TEP 
y puntuaron más alto en esquemas cognitivos con contenidos referentes al abuso, vulnerabilidad al 
daño, imperfección, culpa, apego, abandono y dependencia. 


Rechazo 1 


Desconexión 
y Rechazo 


Rechazo 2 


Estrés 
Postraumático 


Física 
Psicológica 
Sexual 


Autonomía | 


Autonomía 
Deteriorada 


Autonomía 2 


Figura 13.8. — Modelo explicativo probado en el trabajo de Calvete, Estévez y Corral (2007). 
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Los diseños explicativos con variables latentes permiten controlar cualquier variable extraña simple- 
mente incluyéndola en el modelo estructural como variable observable y especificando sus relaciones 
con el resto de variables, observables y latentes (p. ej., Rosário et al., 2012). Una buena idea de la flexibili- 
dad de los modelos SEM la aporta la posibilidad de probar también efectos de mediación y moderación 
utilizando variables latentes (para las que se define un modelo de medida con sus indicadores apropia- 
dos) usualmente comparando el ajuste de dos modelos alternativos que difieren entre sí por incluir o 
no efectos de las terceras variables (p.e., Buelga, Cava y Musitu, 2012; Calvete et al., 2007). 

Los dos diseños explicativos tratados aquí (con variables observables y con variables latentes) se 
postulan para datos transversales. Una generalización de los diseños con variables latentes se emplean 
actualmente también para modelar muchas situaciones de investigación que requieren datos longitu- 
dinales. Más información sobre esta temática puede consultarse en varios trabajos de la monografía de 
Little (2007, 2013). 


13.4. SUGERENCIAS DE ESTUDIO 


Los diseños comparativos representan hoy por hoy más de la mitad de los trabajos de investigación 
publicados en Psicología, Educación, Ciencias Sociales y Ciencias de la Salud, de los que una buena par- 
te son estudios longitudinales. Desgraciadamente, la información bibliográfica de los estudios compa- 
rativos no se encuentra fácilmente accesible, porque tiene muchas ramificaciones aplicadas y la mayor 
parte de ellas son referencias de las Ciencias de la Salud. Una referencia básica, aunque algo antigua, es 
el texto de Anderson ef al. (1980). Más moderna, aunque teóricamente orientada, es Rosenbaum (2010). 

Los diseños longitudinales, tanto prospectivos como retrospectivos, son el estándar de la investi- 
gación no experimental en Psicología. En las últimas décadas se ha realizado un notable esfuerzo para 
mejorar y adaptar las alternativas analíticas al análisis de datos longitudinales, desde el enfoque univa- 
riante clásico al enfoque mixto (modelos multinivel) y el enfoque GEE, pasando por el enfoque multi- 
variante (modelos CGM), tanto con datos numéricos como con datos categóricos. Las referencias más 
recomendables son Arnau y Balluerka (2004) para modelos CGM, Ballinger (2004), para modelos GEE, 
Duncan y Duncan (2004) y Curran, Obeidat y Losardo (2010), para modelos de curva de crecimiento 
y Gibbons et al. (2010), para modelos lineales mixtos. También pueden consultarse a este respecto los 
trabajos de Arnau y Balluerka (2004), Arnau y Bono (2008), Arnau, Balluerka, Bono y Gorostiaga (2010), 
Arnau, Bono, Blanca y Bendayan (2012) y Bono et al. (2008). 

Más recientemente, las alternativas analíticas clásicas se han generalizado para incluir los modelos 
SEM en el análisis de datos longitudinales. Para comprender mejor esta generalización, puede tener 
interés la lectura de un trabajo de Rosel y Plewis (2008). A nivel más avanzado se pueden consultar los 
trabajos de McArdle (2009) y Duncan, Duncan y Strycker (2010) y también muchos de los capítulos de 
la reciente monografía de Little (2013). 

La evaluación de los efectos de terceras variables con los modelos de la estructura SEM para datos 
transversales (y también longitudinales) ha puesto seriamente en duda la aplicación de los modelos de 
mediación y moderación desde el enfoque tradicional de la estructura LM que tratamos en el capítulo 
2. Pueden consultarse a este respecto los trabajos de Cole y Maxwell (2003), Maxwell y Cole (2007), Selig 
y Preacher (2009) y el capítulo 9 de Little (2013). 
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Anexo de tablas estadísticas 


Este Anexo contiene las tablas estadísticas necesarias para tomar conclusiones de carácter inferen- 
cial y facilitar otros cálculos exploratorios que se comentan a lo largo del texto. 


— Latabla A son las probabilidades de los valores Z; de una DISTRIBUCIÓN NORMAL. Nótese que sola- 
mente se contemplan probabilidades asociadas a valores Z; positivos (o sea situados a la derecha 
de la distribución) en el intervalo de 0.00 a 3.59. Si se utiliza Z; como prueba bilateral (o sea, con 
valores positivos y negativos) hay que multiplicar por 2 los valores de probabilidad reportados en 
el cuerpo de la tabla. 


— La tabla B representa valores críticos del estadístico £ de la DISTRIBUCIÓN f DE STUDENT en fun- 
ción de sus grados de libertad (en las filas) para diferentes valores de probabilidad (en las colum- 
nas). Si se emplea como prueba bilateral, los valores críticos de £ deben tomarse de la columna 
de probabilidad correspondiente y divididos por 2. Por ejemplo, para consultar el valor crítico de 
f para una prueba bilateral con a = .05, debe utilizarse la columna a = 0.025 (o sea, 0.05/2). Del 
mismo modo, el valor crítico para una prueba bilateral con a = .01 se consulta en la columna 
a = 0.005 (o sea, 0.01/2). 


— La tabla C son los valores críticos del estadístico y? para una DISTRIBUCIÓN DE x?. 


— la tabla D representa valores críticos al nivel del 5% del estadístico F (columna 3) para una DISTRI- 
BUCIÓN DE F NO CENTRAL en función de los grados de libertad de numerador (g1¡) y denominador 
(g 12), y del parámetro de no centralidad A). En esta tabla también se pueden consultar los valores 
críticos de la DISTRIBUCIÓN F CENTRAL (utilizando las tres primeras columnas) y los valores de 
POTENCIA OBSERVADA dado un valor crítico de F y un valor concreto del parámetro de no centra- 
lidad. 


— La tabla E es similar a la tabla D aportando los valores críticos de F central al nivel del 1%, así 
como los valores de la potencia observada. Nótese que tanto la tabla D como la tabla E asumen 
factores con efectos fijos. 


— La tabla F son coeficientes de polinomios ortogonales, para diferentes grados del polinomio, da- 
dos los niveles (a) de un factor (4) que se asume de naturaleza cuasicuantitativa. Las dos últimas 
columnas de la tabla aportan también la suma cuadrática y la raíz cuadrada de la suma cuadrática 
de los coeficientes. 
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Las tablas G (para a =.05) y H (para a = .01) son de nueva elaboración y aportan valores de la 
potencia observada para factores con efectos aleatorios. Dado un valor crítico de F y del valor de 
F observado, con los grados de libertad de numerador y denominador de la razón, la tabla aporta 
los correspondientes valores de potencia aplicando la ecuación 4.13 (véase sección 4.2.2, p. 160). 


Las tablas I (para a = .05) y] (para a = .01) son también tablas de nueva elaboración, inspiradas 
en las tablas de Sevin y White (1977), que aportan los límites inferior y superior del ESTADÍSTICO 
DE DURBIN-WATSON para probar la existencia de autocorrelación serial (véase sección 12.4.3.A, p. 
463-464), de donde se han seleccionado los valores más comunes relativos al número de casos N 
(o del número de registros temporales, con rango de de 6 a 100) y del número de parámetros q, 
incluyendo predictores y constante (con rango de 2 a 10). 


Finalmente, las tablas K (para a =.05) y L (para a = .01) son los cuantiles superiores (q) de la DIS- 
TRIBUCIÓN DE RANGO *ESTUDENTIZADO? (0 sea, a escala de Student). Ambas tablas son también 
de nueva elaboración. Se consultan con el número de grados de libertad residuales (g/, con rango 
l a oo) y el número de niveles del factor (k, con rango de 2 a 12). 


TABLA A. Distribución Normal N(0, 1) 


Tablas estadisticas 


P(Z=>2Zi) 
Zi .00 -01 .02 03 .04 .05 .06 .07 .08 .09 
0.0 | .5000 | .4960 | .4920 | .4880 | .4840 | .4801 | .4761 | .4721 .4681 .4641 
0.1 .4602 | .4562 — .4522 | .4483 | .4443 | .4404 | .4364 | .4325 | .4286 .4247 
0.2 | .4207 | .4168 | .4129 | .4090 | .4052 — .4013 | .3974 | .3936 | .3897 .3859 
0.3 | .3821 | .3783 | .3745 | .3707 | .3669 — .3632 | .3594 | .3557 | .3520 .3483 
0.4 .3446 | .3409  .3372 | .3336 | .3300 | .3264 | .3228 | .3192 | .3156 .3121 
0.5 | .3085 | .3050 | .3015 | .2981 | .2946 | .2912 | .2877 | .2843 | .2810 .2776 
0.6 | .2743 | .2709 | .2676 | .2643 | .2611 | .2578 | .2546 | .2514 | .2483 .2451 
0.7 | .2420 | .2389 | .2358 | .2327 | .2296 — .2266 | .2236 | .2206 | .2177 .2148 
0.8 | .2119 | .2090 | .2061 | .2033 | .2005 | .1977 | .1949 .1922 | .1894 .1867 
0.9 |—.1841 | .1814 | .1788 | .1762 | .1736 | .1711 | .1685  .1660 | .1635 .1611 
1.0 | .1587 | .1562 | .1539 | .1515 | .1492  .1469  .1446 | .1423 | .1401 .1379 
1.1 .1357 | .1335 | .1314 | .1292 | .1271 | .1251 | .1230 | .1210 | .1190 .1170 
1.2 | .1151 | .1131 | .1112 | .1093 | .1075 — .1056 | .1038 | .1020 | .1003 .0985 
1.3 | .0968 | .0951 | .0934 | .0918 | .0901 | .0885 | .0869 | .0853 | .0838 .0823 
1.4 .0808 | .0793 | .0778 | .0764 | .0749 | .0735 | .0721 | .0708 | .0694 .0681 
1.5 | .0668 | .0655 | .0643 | .0630 | .0618 — .0606 — .0594 | .0582 | .0571 .0559 
1.6 | .0548 | .0537 | .0526 | .0516 | .0505 | .0495 | .0485 | .0475 | .0465 .0455 
1.7 | .0446 | .0436 | .0427 | .0418 | .0409 | .0401 | .0392 | .0384 | .0375 .0367 
1.8 | .0359 | .0351 | .0344 | .0336 | .0329  .0322  .0314 | .0307 | .0301 .0294 
1.9 | .0287 | .0281 | .0274 | .0268 | .0262 | .0256 | .0250 | .0244 | .0239 .0233 
2.0 | .0228 | .0222 | .0217 | .0212 | .0207 | .0202 | .0197 | .0192 | .0188 .0183 
2.1 .0179 — .0174 | .0170 | .0166 | .0162 | .0158 | .0154 | .0150 | .0146 .0143 
2.2 | .0139 | .0136 | .0132 | .0129 | .0125 | .0122 | .0119 | .0116 | .0113 .0110 
2.3 | .0107 | .0104 | .0102 | .0099 | .0096 | .0094 | .0091 | .0089 | .0087 .0084 
2.4 .0082 — .0080  .0078 | .0075 | .0073 | .0071 | .0069 | .0068 | .0066 .0064 
2.5 | .0062 | .0060 | .0059 | .0057 | .0055 | .0054 | .0052 | .0051 | .0049 .0048 
2.6 | .0047 | .0045 | .0044 | .0043 | .0041 | .0040 | .0039 | .0038 | .0037 .0036 
2.7 | .0035 | .0034 | .0033 | .0032 | .0031 | .0030 | .0029 | .0028 | .0027 .0026 
2.8 | .0026 | .0025 | .0024 | .0023 | .0023 | .0022 | .0021 | .0021 .0020 .0019 
2.9 | .0019 | .0018 | .0018 | .0017 | .0016 | .0016 | .0015 | .0015 | .0014 .0014 
3.0 | .0013 | .0013 | .0013 | .0012 | .0012 | .0011 | .0011 | .0011 | .0010 .0010 
3.1 .0010 | .0009 | .0009 | .0009 | .0008 | .0008 | .0008 | .0008 | .0007 .0007 
3.2 | .0007 | .0007 | .0006 | .0006 | .0006 | .0006 | .0006  .0005 | .0005 .0005 
3.3 | .0005 | .0005 | .0005 | .0004 | .0004 | .0004 | .0004  .0004 | .0004 .0003 
3.4 .0003 | .0003 | .0003 | .0003 | .0003 | .0003 | .0003 | .0003 | .0003 .0002 
3.5 | .0002 | .0002 | .0002 | .0002 — .0002 | .0002 | .0002 | .0002 | .0002 .0002 


Fuente: Losilla, J.M. y otros (2005). Del contraste de hipótesis al modelado estadístico (p.314). Girona: EAP SL 
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TABLA B. Distribución t de Student 


Valor ty, tal que P(t>tyY) =a 


gl la .40 .30 .20 10 -050 .025 -010 .005 .001 .0005 
1 .325 .727. 1.376 | 3.078 | 6.314 | 12.71 | 31.82 | 63.66 | 318.30 636.60 
2 .289 .617 1.061 | 1.886 | 2.920 | 4.303 | 6.965 | 9.925 | 22.330 31.600 
3 277 .384| .978 1.638 | 2.353 | 3.182 | 4.541 | 5.841 | 10.220 12.940 
4 .271 .569  .941 1.533 | 2.132 | 2.776 | 3.747 | 4.604 7.173 8.610 


5 .267 .359| .920 1.476 | 2.015 | 2.571 | 3.365 | 4.032 5.893 6.859 
6 .265 .3533| .906 1.440 | 1.943 | 2.447 | 3.143 | 3.707 5.208 5.959 
7 .263 .,49 | .896 1.415 | 1.895 | 2.365 | 2.998 | 3.499 4.785 5.405 
8 .262 .,46| .889 1.397 | 1.860 | 2.306 | 2.896 | 3.355 4.501 5.041 
9 .261 .243 | .883 1.383 | 1.833 | 2.262 | 2.821 | 3.250 4.297 4.781 


10 .260 .242| .879 1.372 | 1.812 | 2.228 | 2.764 | 3.169 4.144 4.587 
11 .260 .40| .876 1.363 | 1.796 | 2.201 | 2.718 | 3.106 4.025 4.437 
12 .259 .339. .873 1.356 | 1.782 | 2.179 2.681 | 3.055 3.930 4.318 
13 .259 .538 | .870 1.350 | 1.771 | 2.160 | 2.650 | 3.012 3.852 4.221 
14 .258 .337 | .868 1.345 | 1.761 | 2.145 | 2.624 | 2.977 3.787 4.140 


15 .258 .36| .866 1.341 | 1.753 | 2.131 | 2.602 | 2.947 3.733 4.073 
16 .258 20351 .865 1.337 | 1.746 | 2.120 | 2.583 | 2.921 3.686 4.015 
17 257 .334 | .863 1.333 | 1.740 | 2.110 | 2.567 | 2.898 3.646 3.965 
18 257 .234 | .862 1.330 1.734 | 2.101 | 2.552 | 2.878 3.611 3.922 
19 237 .333. .861 1.328 | 1.729 | 2.093 | 2.539 | 2.861 3.579 3.883 


20 257 .333| .860 1.325 | 1.725 | 2.086 | 2.528 | 2.845 3.552 3.850 
21 257 .232| .859 1.323 | 1.721 | 2.080 | 2.518 | 2.831 3.527 3.819 
22 .256 .332 | .858 1.321 | 1.717 | 2.074 | 2.508 | 2.819 3.505 3.792 
23 .256 .332| .858 1.319 | 1.714 | 2.069 | 2.500 | 2.807 3.485 3.767 
24 .256 .331| .857 1.318 | 1.711 | 2.064 | 2.492 | 2.797 3.467 3.745 


25 .256 .331| .856 1.316 — 1.708 | 2.060 | 2.485 | 2.787 3.450 3.725 
26 .256 .331| .856 1.315 | 1.706 | 2.056 | 2.479 | 2.779 3.435 3.707 
27 .256 .231 | .855 1.314 — 1.703 | 2.052 | 2.473 | 2.771 3.421 3.690 
28 .256 .330. .855 1.313 | 1.701 | 2.048 | 2.467 | 2.763 3.408 3.674 
29 .256 .230| .854 1.311 | 1.699 | 2.045 | 2.462 | 2.756 3.396 3.659 


30 .256 .530. .854 1.310 | 1.697 | 2.042 | 2.457 | 2.750 3.385 3.646 
40 .255 .329 | .851 1.303 | 1.684 | 2.021 | 2.423 | 2.704 3.307 3.551 
50 .255 .328| .849 1.298 — 1.676 | 2.009 | 2.403 | 2.678 3.262 3.495 
60 .254 .327 | .848 1.296 | 1.671 | 2.000 | 2.390 | 2.660 3.232 3.460 
80 .254 .327| .846 1.292 — 1.664 | 1.990 | 2.374 | 2.639 3.195 3.415 


100 .254 .226. .845 1.290 | 1.660 | 1.984 | 2.365 | 2.626 3.174 3.389 
200 .254 .325|. .843 1.286 | 1.653 | 1.972 | 2.345 | 2.601 3.131 3.339 
500 .253 .325| .842 1.283 | 1.648 | 1.965 | 2.334 | 2.586 3.106 3.310 
¿253 .324| .842 1.282 | 1.645 | 1.960 | 2.326 | 2.576 3.090 3.291 


Fuente: Losilla, J.M. y otros (2005). Del contraste de hipótesis al modelado estadístico (p.315). Girona: EAP SL 


TABLA C. Distribución x* 


Tablas estadisticas 


Valor Xx tal que P(X 2 = y =a 


gl la 995 975 -900 -500 -100 -050 .025 .010 .005 
1 0.000 0.000 0.016 0.455 2.706 3.841 5.024 6.635 7.879 
2 0.010 0.051 0.211 1.386 4.605 5.991 7.378 9.210 10.597 
3 0.072 0.216 0.584 2.366 6.251 7.815 9.348 11.345 | 12.838 
4 0.207 0.484 1.064 3.357 7.779 9.488 11.143 | 13.277 | 14.860 
5 0.412 0.831 1.610 4.351 9.236 11.070 | 12.832 | 15.086 | 16.750 
6 0.676 1.237 2.204 5.348 10.645 | 12.592 | 14.449 | 16.812 | 18.548 
7 0.989 1.690 2.833 6.346 12.017 | 14.067 | 16.013 | 18.475 | 20.278 
8 1.344 2.180 3.490 7.344 13.362 | 15.507 | 17.535 | 20.090 | 21.955 
9 1.735 2.700 4.168 8.343 14.684 | 16.919 | 19.023 | 21.666 | 23.589 
10 2.156 3.247 4.865 9.342 15.987 | 18.307 | 20.483 | 23.209 | 25.188 
11 2.603 3.816 5.578 10.341 | 17.275 | 19.675 | 21.920 | 24.725 | 26.757 
12 3.074 4.404 6.304 11.340 | 18.549 | 21.026 | 23.337 | 26.217 | 28.300 
13 3.565 5.009 7.042 12.340 | 19.812 | 22.362 | 24.736 | 27.688 | 29.819 
14 4.075 5.629 7.790 13.339 | 21.064 | 23.685 | 26.119 | 29.141 | 31.319 
15 4.601 6.262 8.547 14.339 | 22.307 | 24.996 | 27.488 | 30.578 — 32.801 
16 5.142 6.908 9.312 15.338 | 23.542 | 26.296 | 28.845 | 32.000 | 34.267 
17 5.697 7.564 10.085 | 16.338 | 24.769 | 27.587 | 30.191 | 33.409 | 35.718 
18 6.265 8.231 10.865 | 17.338 | 25.989 | 28.869 | 31.526 | 34.805 | 37.156 
19 6.844 8.907 11.651 | 18.338 | 27.204 | 30.144 | 32.852 | 36.191 — 38.582 
20 7.434 9.591 12.443 | 19.337 | 28.412 | 31.410 | 34.170 | 37.566 | 39.997 
21 8.034 10.283 | 13.240 | 20.337 | 29.615 | 32.670 | 35.479 | 38.932 | 41.401 
22 8.643 10.982 | 14.042 | 21.337 | 30.813 | 33.924 | 36.781 — 40.289 | 42.796 
23 9.260 11.688 | 14.848 | 22.337 | 32.007 | 35.172 | 38.076 — 41.638 | 44.181 
24 9.886 12.401 | 15.659 | 23.337 | 33.196 | 36.415 | 39.364 — 42.980 | 45.538 
25 10.520 | 13.120 | 16.473 | 24.337 | 34.382 | 37.652 | 40.646 | 44.314 | 46.928 
26 11.160 | 13.844 | 17.292 | 25.336 | 35.563 | 38.885 | 41.923 | 45.642 | 48.290 
27 11.808 | 14.573 | 18.114 | 26.336 | 36.741 | 40.113 | 43.194 | 46.963 | 49.645 
28 12.461 | 15.308 | 18.939 | 27.336 | 37.916 | 41.337 | 44.461 | 48.278 | 50.993 
29 13.121 | 16.047 | 19.768 | 28.336 | 39.088 | 42.557 | 45.722 | 49.588 | 52.336 
30 13.787 | 16.791 | 20.599 | 29.336 | 40.256 | 43.773 | 46.979 | 50.892 | 53.672 
31 14.458 | 17.539 | 21.434 | 30.336 | 41.422 | 44.985 | 48.232 | 52.191 | 55.003 
32 15.134 | 18.291 | 22.271 | 31.336 | 42.585 | 46.194 | 49.480 | 53.486 | 56.329 
33 15.815 | 19.047 | 23.110 | 32.336 | 43.745 | 47.400 | 50.725 | 54.776 | 57.649 
34 16.501 | 19.806 | 23.952 | 33.336 | 44.903 | 48.602 | 51.966 | 56.061 | 58.964 
33 17.192 | 20.569 | 24.797 | 34.336 | 46.059 | 49.802 | 53.203 | 57.342 | 60.275 
36 17.887 | 21.336 | 25.643 | 35.336 | 47.212 | 50.998 | 54.437 | 58.619 | 61.582 
37 18.586 | 22.106 | 26.492 | 36.335 | 48.363 | 52.192 | 55.668 | 59.892 | 62.884 
38 19.289 | 22.878 | 27.343 | 37.335 | 49.513 | 53.384 | 56.896 | 61.162 | 64.182 
39 19.996 | 23.654 | 28.196 | 38.335 | 50.660 | 54.572 | 58.120 | 62.428 | 65.476 
40 20.707 | 24.433 | 29.051 | 39.335 | 51.805 | 55.758 | 59.342 | 63.691 | 66.766 


Fuente: Losilla, J.M. y otros(2005). Del contraste de hipótesis al modelado estadístico (p.316-7). Girona: EAP SL 
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Valor x? tal que PGé =x? ) =a 
gl la .995 .975 -900 .500 .100 .050 .025 -010 .005 
41 21.421 | 25.215 | 29.907 | 40.335 | 52.949 | 56.942 | 60.561 | 64.950 | 68.053 
42 22.138 | 25.999 | 30.765 | 41.335 | 54.090 | 58.124 | 61.777 | 66.206 | 69.336 
43 22.859 | 26.785 | 31.625 | 42.335 | 55.230 | 59.304 | 62.990 | 67.459 | 70.616 
44 23.584 | 27.575 | 32.487 | 43.335 | 56.369 | 60.481 | 64.202 | 68.710 | 71.893 
45 24.311 | 28.366 | 33.350 | 44.335 | 57.505 | 61.656 | 65.410 | 69.957 | 73.166 
46 25.042 | 29.160 | 34.215 | 45.335 | 58.641 | 62.830 | 66.617 | 71.201 | 74.437 
47 25.775 | 29.956 | 35.081 | 46.335 | 59.774 | 64.001 | 67.821 | 72.443 | 75.704 
48 26.511 | 30.755 | 35.949 | 47.335 | 60.907 | 65.171 | 69.023 | 73.683 | 76.969 
49 27.249 | 31.555 | 36.818 | 48.335 | 62.038 | 66.339 | 70.222 | 74.919 | 78.231 
50 27.991 | 32.357 | 37.689 | 49.335 | 63.167 | 67.505 | 71.420 | 76.154 | 79.490 
51 28.735 | 33.162 | 38.560 | 50.335 | 64.295 | 68.669 | 72.616 | 77.386 | 80.747 
52 29.481 | 33.968 | 39.433 | 51.335 | 65.422 | 69.832 | 73.810 | 78.616 | 82.001 
53 30.230 | 34.776 | 40.308 | 52.335 | 66.548 | 70.993 | 75.002 | 79.843 | 83.253 
54 30.981 | 35.586 | 41.183 | 53.335 | 67.673 | 72.153 | 76.192 | 81.069 | 84.502 
55 31.735 | 36.398 | 42.060 | 54.335 | 68.796 | 73.311 | 77.380 | 82.292 | 85.749 
56 32.491 | 37.212 | 42.937 | 55.335 | 69.918 | 74.468 | 78.567 | 83.514 | 86.994 
57 33.249 | 38.027 | 43.816 | 56.335 | 71.040 | 75.624 | 79.752 | 84.733 | 88.237 
58 34.009 | 38.844 | 44.696 | 57.335 | 72.160 | 76.778 | 80.936 | 85.950 | 89.477 
59 34.771 | 39.662 | 45.577 | 58.335 | 73.279 | 77.931 | 82.117 | 87.166 | 90.715 
60 35.535 | 40.482 | 46.459 | 59.335 | 74.397 | 79.082 | 83.298 | 88.380 | 91.952 
61 36.301 | 41.303 | 47.342 | 60.335 | 75.514 | 80.232 | 84.476 | 89.591 | 93.186 
62 37.069 | 42.126 | 48.226 | 61.335 | 76.630 | 81.381 | 85.654 | 90.802 | 94.419 
63 37.838 | 42.950 | 49.111 | 62.335 | 77.745 | 82.529 | 86.830 | 92.010 | 95.649 
64 38.610 | 43.776 | 49.996 | 63.335 | 78.860 | 83.675 | 88.004 | 93.217 | 96.878 
65 39.383 | 44.603 | 50.883 | 64.335 | 79.973 | 84.821 | 89.177 | 94.422 | 98.105 
66 40.158 | 45.431 | 51.770 | 65.335 | 81.085 | 85.965 | 90.349 | 95.626 | 99.331 
67 40.935 | 46.261 | 52.659 66.335 | 82.197 | 87.108 | 91.519 | 96.828 | 100.55 
68 41.714 | 47.092 | 53.548 | 67.334 | 83.308 | 88.250 | 92.689 | 98.029 | 101.78 
69 42.494 | 47.924 | 54.438 | 68.334 | 84.418 | 89.391 | 93.856 | 99.228 | 103.00 
70 43.275 | 48.758 | 55.329 | 69.334 | 85.527 | 90.531 | 95.023 | 100.43 | 104.21 
71 44.058 | 49.592 | 56.221 70.334 | 86.635 | 91.670 | 96.189 | 101.62 | 105.43 
72 44.843 | 50.428 | 57.113 | 71.334 | 87.743 | 92.808 | 97.353 | 102.82 | 106.65 
73 45.629 | 51.265 | 58.006 | 72.334 | 88.850 | 93.945 | 98.516 | 104.01 | 107.86 
74 46.417 | 52.103 | 58.900 | 73.334 | 89.956 | 95.081 | 99.678 | 105.20 | 109.07 
75 47.206 | 52.942 | 59.795 | 74.334 | 91.061 | 96.217 | 100.84 | 106.39 | 110.29 
76 47.997 | 53.782 | 60.690 | 75.334 | 92.166 | 97.351 | 102.00 | 107.58 | 111.50 
77 48.788 | 54.623 | 61.586 | 76.334 | 93.270 | 98.484 | 103.16 | 108.77 | 112.70 
78 49.582 | 55.466 | 62.483 | 77.334 | 94.373 | 99.617 | 104.32 | 109.96 | 113.91 
79 50.376 | 56.309 | 63.380 | 78.334 | 95.476 | 100.75 | 105.47 | 111.14 | 115.12 
80 51.172 | 57.153 | 64.278 | 79.334 | 96.578 | 101.88 | 106.63 | 112.33 | 116.32 
90 59.196 | 65.647 | 73.291 | 89.334 | 107.56 | 113.15 | 118.14 | 124.12 — 128.30 
100 67.328 | 74.222 | 82.358 | 99.334 | 118.50 | 124.34 | 129.56 | 135.81 | 140.17 
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TABLA D. Distribución FE no central (a =.05) 
F Parámetro de no centralidad A 
gl; gl, crítica .5 1 2 3 4 6 8 12 16 20 30 40 50 60 
1 2 18.51 | .07 | .10 | .14 | .18 | .22 .29 | .36 | .47 | .56  .64 | .78 | .86 | .92 | .95 
3 10.13 | .08 | .11 | .17 | .23|.29 | .40 .49 | .64 | .75 | .83 | .94 | .98 | .99 1 
4 7.71 | 09.12 1.20 1.27 | .34 | .46 | .57 | .74 | .84 | .91 | .98 1 1 
5 6.61 | .09 | .13 | .21 | .29 .37 | .51 | .62 | .79 | .89 | .94 | .99 1 1 
6 5.99 | .09 | .14 | .22 | .31 | .39 | .54 | .66 | .82 | .91 | .96 | .99 1 1 
7 5.59 | .09 | .14 1.23 1.32 | 41 | .56 | .68 | .84 | .93 | .97 1 1 
8 5.32 | .10 1.14 1.24 1.33 | .42 | .58 | .70 | .86 | .94 | .97 1 1 
10 496 1.10 | .15 | .25 | .35 .44  .61 | .72 | .88 | .95 | .98 1 1 
12 475 | .10 | .15 | .26 .36 .45  .63 | .74 | .89 | .96 | .98 1 1 
16 449 | .10 | .16 | .26 .37 .47  .64 | .76 .900 | .96 | .99 1 1 
20 435 | .10 | .16 | .27 .38 | .48 | .65 | .77 | .91 | .97 | .99 1 1 
24 426 | .10 | .16 | .27 .38 | .48 .66 | .77  .91 | .97 | .99 1 1 
30 4.17 | .11 | .16 | 28.39 .49  .66 | .78 | .92 | .97 | .99 1 1 
36 4.11 | .11 | .16 | .28 | .39 .49 | .67 | .79  .92 | .97 | .99 1 1 
48 4.04 | .11 | .16 | .28 | .39 | .50 | .67 | .79  .92 | .97 | .99 1 1 
60 4.00 | .11 | .17 | 29 | .40 .50  .68 | .79 .93 | .98 | .99 1 1 
90 3.95 .11 .17 .29 .40 ¿51 .68 .80 .93 .98 .99 1 1 
120 | 3.92 | .11 | .17 .29|.40 | .51 | .60 | .80 | .93 | .98 | .99 1 1 
2 2 19.00 | .06 | .07 | .10 | .12 1.14 | .18 | .22 | .30 | .36 | .42 | .55 | .65 | .73 | .79 
3 9.55 .07 .08 ¿12 15 .19 ¿25 .32 .44 .54 .63 .79 .88 .93 .96 
4 6.94 .07 .09 .13 .18 .22 ¿31 .39 .54 .66 .75 .90 .96 .98 .99 
5 5.79 | .07 | .10 1.14 .20 | .25 | .35 | .45 | .61 | .74 | .83 | .94 | .98 1 
6 5.14 | .07 | .10 | .15 | .21 | .27 | .38 | .49 | .66 | .79 | .87 | .97 | .99 1 
7 474 | .08 | .10 | .16 .22 | .28 | .41 | .52 | .70 | .82 | .90 | .98 1 1 
8 446 1.08 | .11 | .17  .23 | .30 .43 | .54  .72 | .84 | .91 | .98 1 1 
10 4.10 1.08 | .11 | .18 | .25 .32 | .45 | .588 | .76  .87 | .94 | .99 1 1 
12 3.89 | .08 | .11 | .18 | .26 | .33 | .47 | .60 | .78 | .89 | .95 | .99 1 1 
16 3.63 .08 1.2 .19 .27 .35 .50 .63 .81 .91 .96 1 1 
20 3.49 | .08 | .12 | .20 | .28 | .36 | .52 | .65 | .83 | .92 | .97 1 1 
24 3.40 | .08 | .12 | .20 | .29 | .37 | .53 | .66 | .84 | .93 | .97 1 1 
30 3.32 | .09 | .12 | .21 | .29 | .38 | .54 | .67 | .85 | .94 | .97 1 1 
36 3.26 .09 ¿13 .21 .30 .39 .55 .68 .85 .94 .98 1 1 
48 3.19 .09 2:1:3 .21 .30 .39 .56 .69 .86 .94 .98 1 1 
60 3.15 .09 21:3 .22 .31 .40 .56 .69 .87 .95 .98 1 1 
90 3.10 | .09 1.13 | .22 | .31 | .40 | .57 | .70 | .87 | .95 | .98 1 1 
120 | 3.07 | .09 | .13 | .22 | .31 1.41 1.57 | .71 | .87 | .95 | .98 1 1 
3 2 19.16 | .06 | .07 | .08 | .10 | .11 .14 1.17 | .22 | .27 1.32 | .43 | .52 | .59 | .65 
3 9.28 | .06 | .07 | .10 | .12 | .14 | .19 .24 | .33  .42 | .50 | .66 | .77 | .85 | .90 
4 6.59 | .06 | .08 | .11 | .14 | .17 .24 | .30 | .42 | .53 | .63 | .80 | .89 | .95 | .97 
5 5.41 | .07 | .08 | .12 | .15 | .19 | .27 | .35 | .49 | .61 | .71 | .87 | .95 | .98 | .99 
6 4.76 | .07 | .09 | .12 | .17 .21 .30 | .38 .54 | .67 | .77 | .92 | .97 | .99 1 
7 435 | .07 | .09 | .13 | .18|.22 .32 | .41 | .58 | .72 | .81 | .94 | .98 1 
8 407 | .07 | .09 | .14 .18 | .24 .34 | .44 | .62 | .75 | .84 | .96 | .99 1 
10 3.71 | .07 | .09 | .14 | .20 | .25 | .37 | .48 | .66 | .79 | .88 | .97 1 1 
12 3.49 | .07 | .10 | .15 | .21 | .27 | .39 | .50 | .69 | .82 | .90 | .98 1 1 
16 3.24 | .07 | .10 | .16 | .22 | .29 | .42 | .54 | .73  .86 | .93 | .99 1 1 
20 3.10 | .08 | .10 | .17 | .23 | .30 | .44 | .56 | .75 | .87 | .94 | .99 1 1 
24 3.01 1.08 | .11 | .17 | .24 | .31 | .45 | .58 | .77 | .89 | .95 | .99 1 1 
30 2.92 1.08 | .11 1.17 | .24 | .32 | .46 | .59 | .78 | .90 | .95 1 1 1 
36 2.87 | .08 | .11 | .18 | .25 | .32 | .47 | .60 | .79 | .90 | .96 1 1 1 
48 2.80 | .08 | .11 | .18 | .26 | .33 | .48 | .61 | .81 | .91 | .96 1 1 1 
60 2.76 1.08 | .11 | .18 | .26 | .34 | .49 | .62 | .81 | .92 | .97 1 1 1 
90 2.71 1.08 | .11 | .19|.26 | .34 | .50 | .63 | .82 | .92 | .97 1 1 1 
120 | 2.68 | .08 | .11 | .19|.27 1.35 | .50 | .64 | .83 | .93 | .97 1 1 1 
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F Parámetro de no centralidad A 
gl, gl, crítica 5 1 2 3 4 6 8 12 16 20 30 40 50 60 
4 2 19.25 .06 | .06 | .07 | .09 | .10 | .12 | .14 | .18 | .22 | .26 35 43 | .50 | .56 
3 9.12 .06 | .07 1.08 | .10 | .12 .16 | .20 | .27  .34 | .41 ¿55 57 76  .82 
4 6.39 .06 | .07 | .09 | .12 | .14 | .19 | .24 | .35 .44 (0.53 «70 .82 .89  .94 
5 5.19 06 6.07 ¿10 | .13 | 16 |.22 .28 | .41 22 | 62 .80 .90 | .95 .98 
6 4.53 .06 —.08  .11 ¿14 | ¿07 [1.25 32 .46 | .58 | .69 .86 94 | .98 | .99 
7 4.12 .06 | .08 | .11 .15 | .19 | .27 | .35 50 | .63 | .73 .90 .96 | .99 1 
8 3.84 .07 [| .08 | .12 | .16 | .20 | .28 | .37 | .53 .67 | .77 .92 .98 | .99 1 
10 3.48 07 6.09 | 13 | .17.| 21 31 41 28 1.72 | .82 .95 .99 1 1 
12 3.26 .07 [| .09 | .13 | .18 | .23 | .33 | .43 .62 .76 | .85 .96 .99 1 1 
16 3.01 .07 [| .09 | .14 | .19 | .25 | .36  .47 | .66 | .80 | .89 .98 1 1 1 
20 2.87 .07 [| .09 | .14 | .20 | .26 | .38 | .50 | .69 | .83 | .91 .98 1 1 1 
24 2.78 07. 10 1.15 | .21 27 (,39 | .51 7 .84 | .92 .99 1 1 1 
30 2.69 .07 | .10 | .15 | .21 .28 | .41 ¿53 .73 .86 | .93 .99 1 1 1 
36 2.63 .07 1.10 .15 1.22 | .28 .42 1.54 | .74  .87 | .94 .99 1 1 1 
48 2.57 .07 1.10 .16 | .22 | .29 .43 | .56 | .76 .88 | .94 .99 1 1 1 
60 2.53 .07 [| .10 | .16 | .23 | .30 | .44 | .57 | .77 | .89 | .95 .99 1 1 1 
90 2.47 .07 [| .10 | .16 | .23 | .30 | .45 | .58 | .78 | .90 | .95 1 1 1 1 
120 2.45 .08 1.10 .17 | .24 | .31 45 | .59  .78 | .90 | .96 1 1 1 1 
5 2 19.30 .05 .06 —.07 | .08 | .09 | .11 .12 ¿16.19 | .22  .30 .37 | .43 48 
3 9.01 .06 | .06 | .08 | .09 | .11 ¿14 (ar [23 .29 11.35 | .48 59 | .68 | .75 
4 6.26 06 61.07 .09 | .10 | .12 |.17 .21 .29 | .38 | .45 | .62 .75 .83 .89 
5 5.05 .06 | .07 | .09 | .11 .14 1).19| .24 | .35 45 1.54 | .73 .84 | .91 .95 
6 4.39 .06 | .07 | .10 .12 | .15 | .21 .27 | .39 | .51 .61 .80 .90 | .95 .98 
yd 3.97 .06 | .07 | .10 | .13 | .16 | .23 | .30 | .43 56 | .66 | .84 .93 .97 | .99 
8 3.69 ¿06.108 1-11 14 | ¿17 | .24 | .32 .47 | .60 | .70 | .88 .95 .98 | .99 
10 3.33 .06 | .08 | .11 .15 1.19 | .27 | .35 .52 .65 | .76 | .92 .98| .99 | .00 
12 3.11 .07 [| .08 | .12 | .16 | .20 | .29 | .38 | .55 .69 | .80 | .94 .99 1 1 
16 2.85 07 61.08 12 |..17 |.22 | .32 42 .60 | .75 | .85 | .96 .99 1 1 
20 2.71 .07 1.09 .13 | .18 | .23 .34 | .44 | .63 .78 (| .87  .97 1 1 1 
24 2.62 .07 [| .09 | .13 | .18 | .24 | .35 | 46 | .66 | .80 | .89 | .98 1 1 1 
30 2.53 .07 [| .09 | .14 | .19 | .25 | .36 | 48 | .68 | .82 | .90 | .98 1 1 1 
36 2.48 .07 [| .09 | .14 | .19 | .25 | .37 | .49 | .69 | .83 | .91 .99 1 1 1 
48 2.41 .07 | .09 .14 | .20 | .26 .39 | .51 71 .85 .92 | .99 1 1 1 
60 2.37 07 61.09 .15 | .20 | .27 40.52 12 .86 .93 | .99 1 1 1 
90 2.32 07  —10 | 15 | .21 .28 | .41 53 .74 | .87 | .94 | .99 1 1 1 
120 2.29 7 |(10. 15 | 21 .28 | .41 54 | .75 .87 .94 | .99 1 1 1 
6 2 19.33 .05 .06 | .07 | .07 —.08 | .10 | .11 .14 1.17 | .20 | .26 .32 38.43 
3 8.94 .06 | .06 | .07 | .09 | .10 | .12 | .15 .20 1 .25| .30 | .42 52 .61 .69 
4 6.16 .06 | .06 | .08 | .10 | .11 TS + .33 | .40 | .56 .68 .78 | .85 
5 4.95 .06 | .07 | .09 | .10 | .12 | .17 | .21 .30 | .39 | .48 | .66 .79 .87 | .93 
6 4.28 06 —1,.07 6.09 |.11 .14 [| .19 | .24 | .35 451.55 1|.74 .86 .93 .96 
rá 3.87 .06 | .07 | .09 | .12 | .14 | .20 | .26 | .38 | .50 | .60 | .79 .90 .95 .98 
8 3.58 .06 | .07 | .10 | .12 | .15 | .22 | .28 | .41 54 | .64 | .83 93 .97 6.99 
10 3:22 06 6,07 —.10 | .13 | .17 (6.24  .31 .46 | .60 | .71 .88 .96 .99 1 
12 3.00 ¿06.08.11 .14 | .18 1.26 .34 | .50  .64 | .75 | .91 .97 .99 1 
16 2.74 06 6.08 .11 .15  .19|.28 | .38 | .55 .70 | .81 95 .99 1 1 
20 2.60 87 6.08 12 | 16. .21 30.40 | .59  .73| .84 | .96 .99 1 1 
24 2.31 07 6.008. 12 (17 | .21 32 | .42 .61 .76  .86 | .97 .99 1 1 
30 2.42 07 60.09 1.13  .17/|.22 | .33 44 | .63 .78 | .88 | .98 | 1.00 1 1 
36 2.36 .07 [| .09 | .13 | .18 | .23|.34 | .45 .65 .80 | .89 | .98 | 1.00 1 1 
48 2.29 .07 [| .09 | .13 .18 | .24 | .36 | .47 | .67 | .81 .90 | .99 | 1.00 1 1 
60 2.25 .07 [| .09 | .14 | .19 | .24 | .36 | .48 | .69 | .83 | .91 .99 | 1.00 1 1 
90 2.20 .07 [| .09 | .14 | .19 | .25 | .38 | .50 | .70 | .84 | .92 | .99 | 1.00 1 1 
120 2.18 .07 1.09 .14 | .20 | .26 6.38 | .51 7 .85 | .93 | .99 | 1.00 1 1 
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F Parámetro de no centralidad 4 

gl; gl, crítica 5 1 2 3 4 6 8 12 16 20 30 40 50 60 
7 2 19.35 .05 | .06 | .06 | .07 | .08 | .09 | .10 | .13 | .15 | .18 | .24 .29| .34 | .39 
3 8.89 .05 | .06 | .07 | .08 | .09 | .11 .13 1.18 | .22 | .27 | .37 47 | .56 | .63 
4 6.09 .06 —.06 | .08 | .09 | .10 | .13 | .16 | .23 | .29 | .35 | .50 .62 .72  .80 
5 4.88 .06 —.06 | .08 | .10 | .11 15 .19 | .27 1.35  .43 | .60 ¿23 .83 | .89 
6 4.21 .06 .07 .08 .10 12 ¿17 21 31 .40 .49 .68 .81 .89 .94 
7 3.79 .06 .07 .09 MM 13 .18 23 .34 45 .54 .74 .86 .93 .97 
8 3.50 .06 | .07 | .09 | .11 14 1.19 .25| .37 | .488  .59 | .78 .90 | .95 | .98 
10 3.14 .06 .07 .10 ¿12 .15 ¿21 .28 42 .54 .66 .85 .94 .98 .99 
12 2.91 .06 | .07 | .10 | .13 | .16 | .23 | .31 45 1.59 | .70 | .88 .96 | .99 1 
16 2.66 .06 | .08 | .11 14 1.18 .26 | .34 | .51 .65 | .76 | .93 .98 1 1 
20 2.51 .06 | .08 | .11 .15 1 .19|.28 | .37 .54| .69 | .80 | .95 .99 1 1 
24 2.42 .06 .08 .11 .15 .20 .29 .38 .57 72 .82 .96 .99 1 1 
30 2.33 .06 .08 12 ¿16 .21 .30 .40 .59 .74 .85 .97 .99 1 1 
36 2.28 .07 | .08 | .12 | .16 | .21 31 42 | .61 .76 1.86 | .97 1 1 1 
48 2.21 .07 .08 .12 17 .22 .33 .44 .64 .78 .88 .98 1 1 1 
60 2.17 .07 1.09 | .13 | .17 | .23 | .34 | 45 | .65 | .80 | .89 | .98 1 1 1 
90 2.11 ¿07 .09 ¿13 .18 .23 .35 47 ¿07 .81 .90 .99 1 1 1 
120 2.09 .07 | .09| .13| .18 | .24  .36 | .47 | .68 | .82 | .91 .99 1 1 1 
8 2 19.37 .05 | .06 | .06 | .07 | .07 | .09 | .10 | .12 | .14 | .16 | .22 .26 | .31 .35 
3 8.85 .05 | .06 | .07 | .08 | .09 | .10 | .12 | .16 | .20 | .24 | .34 .43 51 .58 
4 6.04 .06 .06 .07 .08 .10 12 .15 .20 .26 32 45 YA .67 .75 
5 4.82 .06 .06 .08 .09 dl .14 5L:Z .24 .32 .39 .55 .68 .78 .85 
6 4.15 .06 —.06 | .08 | .10 | .11 .15 .19 | .28 | .36 | .45 | .63 .76 | .86 | .92 
7 E .06 .07 .08 10 12 .16 ¿21 31 .40 .50 .69 .82 .90 .95 
8 3.44 .06 .07 .09 ¿1 .13 .18 .23 .33 .44 .54 .74 .86 .93 .97 
10 3.07 .06 .07 .09 ¿1 .14 .20 .26 .38 .50 .61 .81 .92 .97 .99 
12 2.85 .06 | .07 | .09 | .12 | .15 | .21 28 | 421 .54  .66 | .85 .94 | .98 | .99 
16 2.59 .06 .07 .10 ¿13 .16 .24 .31 47 .61 .72 .90 .97 .99 1 
20 2.45 .06 .08 .10 .14 .17 .25 .34 .50 .65 27 .93 .98 1 1 
24 2.36 .06 | .08 | .11 .14 1.18 | .27 | .36  .53|.68 | .79 | .94 .99 1 1 
30 2.27 .06 | .08 | .11 .15 | .19|.28 | .38 | .56 | .71 .82 .96 .99 1 1 
36 2.21 .06 | .08 | .11 .15 | .20 | .29 | .39 .58 | .73 | .84 | .96 .99 1 1 
48 2.14 .06 .08 12 ¿16 .21 .31 41 .60 .75 .86 .97 1 1 1 
60 2.10 .07 .08 ¿12 .16 .21 .31 .42 .62 .27 .87 .98 1 1 1 
90 2.04 .07 .08 12 17 22 .33 .44 .64 .79 .89 .98 1 1 1 
120 2.02 .07 1.08 | .13 | .17 | .22 | .33 | 45 | .65 | .80 | .89 | .98 1 1 1 
9 2 19.38 .05 | .06 | .06 | .07 | .07 | .08 | .09 | .11 .13 | .15 | .20 .24 | .28| .32 
3 8.81 .05 | .06 | .07 | .07 | .08 | .10 | .12 | .15 | .19 | .22 | .31 391.47 | .53 
4 6.00 .05 | .06 | .07 | .08 | .09 | .11 .14 | .19| .24 | .29 | .41 ¿53 .62  .70 
5 4.77 .06 | .06 | .07 | .09 | .10 | .13 | .16 | .22 | .29 | .35 | .51 .64 | .74 | .82 
6 4.10 .06 —.06 | .08 | .09 | .11 .14 1.18 | .25 | .33 | .41 .58 .72 .82 | .89 
7 3.68 .06 —.06 | .08 | .10 | .11 15 | .19 .28| .37 | .46 | .65 .78 | .87 | .93 
8 3.39 .06 | .07 | .08 | .10 | .12 | .16 | .21 231 40 | .50 | .70 .83 91 .95 
10 3.02 .06 | .07 | .09 | .11 131.18 .23| .35 1 .46 | .57 | .77 .89 | .95 | .98 
12 2.80 .06 .07 .09 Ml .14 .20 ,26 .38 51 .62 .82 .92 .97 .99 
16 2.54 .06 .07 .10 12 .15 22 .29 .43 .57 .69 .88 .96 .99 1 
20 2.39 .06 .07 .10 13 .16 .23 .31 47 .61 .73 .91 ¿97 .99 1 
24 2.30 .06 1.07 | .10 | .13 | .17 | .25 .33|.50 | .64 | .76 | .93 .98 1 1 
30 2.21 .06 | .08 | .11 .14 1.18 | .26 | .35  .52| .68 | .79 | .94 .99 1 1 
36 2.15 .06 | .08 | .11 .14 1.18 | .27 | .36 | .55 | .70 | .81 .95 .99 1 1 
48 2.08 .06 | .08 | .11 .15 1.19 | .29 | .38  .57 | .73 | .84 | .96 .99 1 1 
60 2.04 .06 .08 .11 .15 .20 .30 .40 .59 .74 .85 .97 1 1 1 
90 1.99 .06 .08 12 ¿16 .21 ¿31 41 .61 77 .87 .98 1 1 1 
120 1.96 .06 —.08 | .12 | .16 | .21 .32 | .42 | .62 | .78 | .88 | .98 1 1 1 


536 Tablas Estadisticas 


F Parámetro de no centralidad A 

gl; gl, crítica 5 1 2 3 4 6 8 12 16 20 30 40 50 60 
10 2 19.40 05 (.05 6.06 |.06 .07 |.08 | .09 |.11 .12 | ,14 | ,18 23 .26 | .30 
3 8.79 ¿205 (.06 -.06 |.07 —.08 | .09 | .11 14 | .17 | 20 28 .36 | .43 .50 
4 5.96 05 (.06 .07 |.08 .09 |,11 ¿13 [| 17 | 22 | 2/7 6.38 .49 —.58 | .66 
5 4.74 ¿06 | .06 07 |(.08 ¿09 |.12 15 | .20 | .26 | .32 47 59 | .70 | .78 
6 4.06 ¿06 (.06  .07 |.09 .10 |.l3 .16 | .23 | .30 | .38 | .54 .68 | .78 | .86 
7 3.64 .06 .06 | .08 | .09 | .11 .14 | .18 .26 | .34 | .422 | .60 .74 .84 | .91 
8 3.35 .06 | .06 | .08 | .10 | .11 .15 .19 | .28 | .37 | .46 | .66 .80 | .88 | .9%4 
10 2.98 ¿06 (|(.07 6.08 |—.10  .12 17 | 22 | 32 43 |.53 273 .86 | .93 .97 
12 25 ¿06 (¿07 6.09 |.11 ¿13 .18 1.24 | .35  .47 | .58 | .79 901.96. .98 
16 2.49 106 |(.07 1.09 1.12 .,14 | .20 | .27 | 40 .53 .65  ,85 .95 .98 | .99 
20 2235 06 (1.07 .10 | 12 6.5 22 .29|1.44|.58 .70 | .89 .97 —.99 1 
24 2.25 ¿06 (.07 6.10 1.13 16 | .23 31 47 | .61 Ars IA | .98 | .99 1 
30 2.16 ¿206 (.07 5.10 1.13 .17 | 24 | 33 | 50 .64 | .76 .93 .98 1 1 
36 211 .06 1.07 1.10 | .14 .17 | .26 | .34  .52 | .67 | .79 | .94 .99 1 1 
48 2.03 06 (1.08 6.11 .14 (1.18 | .27 | 36 .54 | .70 | .81 .96 .99 1 1 
60 1.99 .06 | .08 | .11 115 -,19 [| .28 | 37 1.56 .7/2 | .83 96 .99 1 1 
90 1.94 ¿D6 (.08 .11 .15 .20 .29| .39 6.59  .74 | .85 | .97 1 1 1 
120 1.91 ¿06 | .08 11 .16 .20 | .30| .40 .60 | .75 | .86 | .97 1 1 1 
12 2 19.41 ¿05 (.05 6.06 |.06 ¿07 |:07 | .08 |(.,10 6.11 3 «16:20 23 .26 
3 8.74 ¿05 (06 6.06 |.07 —6.¿07 | .09 |.,10 | .13 | .15 | .18 .25 |.3 .37 | .43 
4 5.91 ¿05 (.06 6.06 |.07 6,08 |.10 | .12 (.15 .19 | .23 1.33 | 42 51 .59 
5 4.68 ¿205 (.06 .07 |.08 .09 | .11 113 | .118 | 23 28 41 ¿52 .62 71 
6 4.00 05 (.06 1.07 (1.08 .09 | .12 .14 1.20 | .26 | .32 | .47 | .61 21 .80 
7 3.57 ¿06 | .06. 07 |(.08 .10 |.13 J16 | 22 1,29 (1.36 53 67 .78 | .86 
8 3.28 ¿06 (1.06  .07 |.09 .10 |.13 .17 1.24 | .32 .40 | .58 | .73 .83 .90 
10 2.91 .06 .06 | .08 | .09 | .11 ¿15 .19 | .28 | .37 | .46 | .66 | .81 .90 | .95 
12 2.69 06 |.06 .08 |.10  .12 .16 | 21 34 41 5 .72 | .86 .93 .97 
16 2.42 ¿06 (|.07 .09 |.11 13 .18 | .23 | .35 | .47 | .59 .80 | .9 .97 | .99 
20 2.28 .06 1.07 | .09 | .11 .14 (1.19 | .26 | .39 .52 | .64 | .84 | .94 .98 | .99 
24 2.18 206 (1.07 09 | .12 .,14 | .21 .27 | .41 155 | 67 | 87 6.96 .99 1 
30 2.09 ¿D6- (07 —.09 6.12. .15 22 .29 1.44 | .59 | .71 .90 | .97 .99 1 
36 2.03 06 (.07 1.10 1.13 .,16 | .23 31 .47 | .61 .74 1.92 .98 1 1 
48 1.96 .06 1.07 1.10 | .13 1.17 1.24 | .33 .50 .65 | .77  .94 | .99 1 1 
60 1.92 ¿06 (.07 —.10 |.13 .17 | .25 34 | .51 ¿67 | 79 | 95 99 1 1 
90 1.86 .06 | .08 | .11 .14 1.18 | .26 | 36  .54 | .70 | .81 .96 | .99 1 1 
120 1.83 .06 | .08 | .11 214 60,18 | .27 | .37 1.56 | .71 .83 | .96 .9 1 1 
16 2 19.43 ¿05 (.05 .06 |.06 .06 | .07 | .07 |(.09 | .10 | .11 .14 | .16 ¿19 | .22 
3 8.69 .05 | .05 | .06 | .06 | .07 | .08 | .09 | .11 13 | 145 |.20. 25 -30 | .35 
4 5.84 ¿205 (.06 .06 |.07 —.07 | .09 | 10 | .13 | .15 | .18 .26 | .33 .41 .48 
5 4.60 ¿05 (.06. 6.06 |.07 6.08 |.09 | ,11 .14 1.18 | .22 .32 | .42 3) .59 
6 3.92 ¿05 (¿06 6.07 |.¿07 .,08 |.10 | .12 |(.16. 21 .25 1.37 | .49 .59 | .68 
7 3.49 205 (.06 .07 |.08 .09 | .11 13 | 18 | 23 | .28 .42 6.55 .66 | .75 
8 3.20 .05 .06 | .07 | .08 '.09 | .11 .14 1.19 | .25 | .31 .47 | .61 72 .81 
10 2.83 ¿05 (06 6.07 (1.08 .10 |.12 15 | 22 1,29 (1.37 1.55 70 .81 .88 
12 2.60 ¿06 (.06 .07 (1.09 6.10 |.13 .17 1.24 | .33 | .41 .61 .76 .86 | .93 
16 2.33 .06 | .06 | .08 | .09 | .11 ¿15 .19 | .28| .38 .48 | .69 | .84 .92 .97 
20 2.18 ¿06 (.06 .08 (1.10. .12 A 31 42 | .53 | .75 | .89 .95 .98 
24 2.09 ¿06 (|.07 .08 |(.10 12 17 | 22 | 34 ¿46 | .57 6.79 | .91 .97 | .99 
30 1.99 06 |(.07 6.09 | .11 .13 .18 | .24 | .37 | .50 | .61 .83 .94 .98 | .99 
36 1.93 ¿06 (07 6.09 |.11 ¿13 .19 (1.25 | .39 | .52 | .65 | .86 | .95 .99 1 
48 1.86 ¿06 |(.07 6.09 |,11 .14 1.20 .27| 42 6.56  .69 | .89 | .97 .99 1 
60 1.82 .06 |.07 1.09 1.112 6.15 «211 .28 1.44 | .59 | .71 .91 .98 .99 1 
90 1.76 ¿06 (07. ¿10 (1,12 15 23 301.47 | .62 .75 | .9 | .98 1 1 
120 1.73 206 (.07 |—.10 |.13 16 | .23 «31 48 1.64 | .76  .94 | .99 1 1 


Tablas estadísticas 537 


F Parámetro de no centralidad A 
gl gl, crítica ¿3 1 2 3 4 6 8 12 16 20 30 40 50 60 


20 2 19.45 .05 | .05 | .05 | .06 | .06 | .06 | .07 | .08 | .09 | .10 | .12 | .14 .16 | .19 
3 8.66 .05 | .05 | .06 | .06 | .06 | .07 | .08 | .09 | .11 E | ¿25 .29 
4 5.80 .05 | .05 | .06 | .06 | .07 | .08 | .09 | .11 .13 | .15 | .21 .28 .34 | .40 
5 4.56 .05 | .06 | .06 | .07 | .07 | .08 | .10 | .12 | .15 | .18 | .26 | .34 .42 .50 
6 3.87 .05 | .06 | .06 | .07 | .08 | .09 | .10 | .14 | .17 | .21 .31 .40 .50 | ..58 
7 3.44 .05 | .06 | .06 | .07 | .08 | .09 | .11 .15 1 .19|.23| .35 | .46 .57 | .66 
8 3.15 .05 | .06 | .06 | .07 | .08 | .10 | .12 | .16 | .21 .26 | .39 | .51 .62 .72 
10 2.77 .05 | .06 | .07 | .08 | .09 | .11 .13,.18|.24 | .30  .46  .60 .72 .81 
12 2.54 .05 | .06 | .07 | .08 | .09 | .12 | .14 | .20 | .27 | .34 | .51 .67 .78 | .87 
16 2.28 .06 | .06 | .07 | .08 | .10 | .13 | .16 | .24 | .32 | .40  .60 | .76 .87 | .93 
20 2.12 .06 | .06 | .07 | .09 | .10 | .14 | .18 | .26 | .36 | .45 | .67 | .82 .91 .96 
24 2.03 .06 | .06 | .08 | .09 | .11 .15 | .19 .28 | .39 | .49 | .71 .86 .94 | .98 
30 1.93 .06 —.06 | .08 | .10 | .11 .16 | .20 | .31 42 1.53 | .76 | .90 96 | .99 


36 1.87 .06 | .06 | .08 | .10 | .12 | .16 | .22 | .33 | .45 | .57 | .79 | .92 .97 | .99 
48 1.79 .06 | .07 | .08 | .10 | .13 .18 | .23 | .36 | .49 | .61 .84 | .94 98 1 
60 1.75 .06 | .07 | .09 | .11 .13|.19 .25|.38 .52  .64 | .86 | .96 .99 1 
90 1.69 .06 | .07 | .09 | .11 .14 | .20 | .27 | .41 .56 —.68 | .89 | .97 .99 1 


120 1.66 .06 | .07 | .09 | .11 .14 | .21 .28 1.43 | .58 | .71 91 .98 1 1 


24 2 19.45 .05 | .05 | .05 | .06 | .06 | .06 | .07 | .07 | .08 | .09 | .11 .13 | .15 .16 
3 8.64 .05 | .05 | .06 | .06 | .06 | .07 | .07 | .09 | .10 | .11 .15 1.18 | .22 .25 
4 5.77 .05 | .05 | .06 | .06 | .07 | .07 | .08 | .10 | .12 | .14 .19 | .24 | .29 .34 
5 4.53 .05 | .05 | .06 | .06 | .07 | .08 | .09 | .11 .13 .16 | .22 | .29 | .36 .43 
6 3.84 .05 | .05 | .06 | .07 | .07 | .08 | .09 | .12 | .15 | .18  .26 | .34 | .43 51 
Z 3.41 .05 | .06 | .06 | .07 | .07 | .09 | .10 | .13 | .17 | .20  .30  .39 | .49 .58 
8 3.12 .05 | .06 | .06 | .07 | .08 | .09 | .11 .14 1.18 | .22 1.33 | .44 | .54 .64 
10 2.74 .05 | .06 | .06 | .07 | .08 | .10 | .12 | .16 | .21 .26 1.39  .52 | .64 .73 
12 2.51 .05 | .06 | .07 | .07 | .08 | .10 | .13 | .18 | .23 | .29  .44 | .59 | .71 .80 
16 2.24 .05 | .06 | .07 | .08 | .09 | .11 .14 | .20 | .27 | .35  .53  .68 | .80 -88 
20 2.08 .05 | .06 | .07 | .08 | .10 | .12 | .16 | .23 | .31 39 | .59 .75 | .86 .93 
24 1.98 .06 | .06 | .07 | .09 | .10 | .13 | .17 | .25 | .34 | 43 .64 .80 | .90 .95 

1.89 .06 | .06 | .07 | .09 | .10 | .14 | .18 | .27 | .37 | .47  .69 | .85 | .93 .97 

1.82 .06 | .06 | .08 | .09 | .11 .15 | .19 .29| 40 | .50  .73  .88 | .95 .98 
48 1.75 .06 | .06 | .08 | .10 | .12 | .16 | .21 .32 1.43 | .55 | .78 | .91 .97 .99 

1.70 .06 | .06 | .08 | .10 | .12 | .17 | .22 | .34 | .46 | .58 | .8l .93 | .98 .99 

1.64 .06 | .07 | .08 | .10 | .13 | .18 | .24 | .37 | .50 | .63 .85 | .95 | .99 1 
120 1.61 .06 | .07 | .09 | .11 .13 | .19 .25 | .39 | .53 | .65 | .87 | .96 .99 1 


30 2 19.46 .05 | .05 | .05 | .05 | .06 | .06 | .06 | .07 | .08 | .08 | .10 | .11 .13 .14 
3 8.62 .05 | .05 | .05 | .06 | .06 | .06 | .07 | .08 | .09 | .10 | .13 | .15 | .18 «21 
4 5.75 .05 | .05 | .06 | .06 | .06 | .07 | .07 | .09 | .10 | .12  .16 | .20 | .24 .28 
y) 4.50 .05 | .05 | .06 | .06 | .06 | .07 | .08 | .10 | .12 | .13 .19 | .24 | .29 .35 
6 3.81 .05 | .05 | .06 | .06 | .07 | .08 | .09 | .11 .13 | .15 | .21 .-28: 1:35 .42 
7 3.38 .05 | .05 | .06 | .06 | .07 | .08 | .09 | .11 .14 1.17 | .24 | .32 | .40 .48 
8 3.08 .05 | .05 | .06 | .07 | .07 | .08 | .09 | .12 | .15 | .18 | .27 | .36 | .45 53 
10 2.70 .05 | .06 | .06 | .07 | .07 | .09 | .10 | .14 | .17 | .21 .32 1.43 6.53 .63 
12 2.47 .05 | .06 | .06 | .07 | .08 | .09 | .11 .15 | .19|.24 | .36 | .49 | .60 .70 
16 2.19 .05 | .06 | .07 | .07 | .08 | .10 | .12 | .17 | .23 | .28  .44 | .59 | .71 .81 
20 2.04 .05 | .06 | .07 | .08 | .09 | .11 .13 | .19|.25 | .32 .50  .66 | .78 .87 
24 1.94 .05 | .06 | .07 | .08 | .09 | .11 .14 | .21 ¿28 1:33 | 35 | «21 .83 .91 


30 1.84 .05 | .06 | .07 | .08 | .09 | .12 | .15 | .23 | .31 .39 1.60 | .77 | .88 .94 

36 1.78 .06 | .06 | .07 [| .08 | .10 .13 | .16 | .24 | .33 | .43 | .64 | .81 91 .96 

48 1.70 .06 | .06 | .07 | .09 | .10 | .14 | .18 | .27 | .37 | .47  .70  .86 | .94 98 

60 1.65 .06 | .06 | .08 | .09 | .11 .15 | .19  .29 | .40 | .51 .74 | .89 | .96 .99 

90 1.59 .06 —.06 | .08 | .10 | .11 .16 | .21 321.44 | .56 | .79 | .92 | .97 .99 
1 


.55 .06 —.06 | .08 | .10 | .12 | .16 | .22 | .33 | 46 | .58  .82 | .94 | .98 1 


538 Tablas Estadisticas 


F Parámetro de no centralidad 2 

gl; gl, crítica 20 1 2 3 4 6 8 12 16 20 30 40 50 60 
40 2 19.47 .05 05 1.05 .05 | .05 | .06 |—.06 .06 |.07 —.07 | .09 |.10- .1] 12 
3 8.59 .05 .05 | .05 | .06 | .06 | .06 | .06 | .07 | .08 | .09 | .11 AS ds 17 
4 5.72 .05 .05 | .05 | .06 | .06 | .06 | .07 | .08 | .09 | .10 | .13 | .16 | .19 | .22 
5 4.46 .05 .05 | .06 | .06 —.06 | .07 | .07 | .08 | .10 | .11 15 | 19 | .23 | .27 
6 3.77 .05 .05 | .06 | .06 | .06 | .07 | .08 | .09 | .11 ¿12 (17 (1.22 | .27 | .32 
7 3.34 .05 .05 | .06 | .06 | .06 | .07 | .08 | .10 | .11 ¿IS (1.19 (1.25 31 37 
8 3.04 .05 05.06 .06 .07 | .07 —.08 .10 | .12 .15 | .21 .27 1.34 | .41 
10 2.66 .05 .05 | .06 | .06 | .07 | .08 | .09 | .11 14 10.171 .24  .33 | .41 .50 
12 2.43 .05 .05 | .06 | .06 | .07 | .08 | .09 | .12 .15 1.18 | .28 | .38 | .47 | .57 
16 2.15 .05 .06 1.06 | .07 | .07 [| .09 .10  .14 | .18 .22 | .34 .46 | .57 | .68 
20 1.99 .05 .06 | .06 | .07 —.08 | .09 | .11 215 .20 | .25 | .39 | .53 | .65 | .76 
24 1.89 .05 06 1.06 .07 |(.08 | .10 (1.12 .16 ||.22 .27 | 43 |.58  .71l .81 
30 1.79 .05 .06 | .07 —.07 | .08 | .10 .13 | .18 | .24 | .31 48 1.64 | .77 | .87 
36 1.73 .05 .06 | .07 | .08 | .09 | .11 .13 | .19 | .26 | .33  .52 | .69 | .82 | .90 
48 1.64 .05 .06 | .07 | .08 | .09 | .12 .15 | .22 .29|.38 | .59 | .76 | .87 | .94 
60 1.59 .05 .06 | .07 | .08 | .09 | .12 .16 | .23 32 | .41 .63 | .80 | .90 | .96 
90 1.53 .06 | .06 | .07 —.09 | .10 | .13 .17 | .26 | .36 | 46  .70 | .86 | .94 | .98 
120 1.50 .06 | .06 | .07 —.09 | .10 | .14 | .18 | .28 | .38 | 49 | .73 .88 | .96 | .99 
60 2 19.48 .05 .05 | .05 | .05 | .05 | .05 .06 | .06 | .06 | .07 — .07 | .08 | .09 | .10 
3 8.57 .05 .05 | .05 | .05 | .05 | .06 | .06 | .06 | .07 | .07 | .09 | .10 | .11 «13 
4 5.69 .05 .05 | .05 | .05 | .06 | .06 | .06 | .07 | .08 | .08 | .10 | .12 | .14 | .16 
5 4.43 .05 .05 | .05 | .06 | .06 | .06 | .06 | .07 | .08 | .09 | .11 .14 16 | .19 
6 3.74 .05 05 6.05 .06 | .06 | .06 |.07 .08 |.09 .10 |.12 |.15 19 |.22 
7 3.30 .05 .05 | .05 | .06 | .06 | .06 | .07 | .08 | .09 | .10 | .14 | .17 | .21 ¿25 
8 3.01 .05 .05 | .05 | .06 —.06 | .07 | .07 | .08 | .10 | .11 15 (| .19 | 23 |.28 
10 2.62 .05 05 1.06  .06 | .06 | .07 |(.08 .09 |. ¿12 | ,17 (| .22 .28 | .34 
12 2.38 .05 .05 | .06 | .06 | .06 | .07 | .08 | .10 | .11 .13 | .19|.25 | .32 | .39 
16 2.11 .05 .05 | .06 | .06 | .07 | .07 | .08 | .11 IS 16 |.23 | 0.31 40 | .48 
20 1.95 .05 .05 | .06 | .06 | .07 | .08 | .09 | .11 .14 1.17 | .26 | .36 | .46 | .56 
24 1.84 .05 05 .06 -.06 | .07 | .08 | .09 .12 16 .19 | .29 | .41 322 | ¿62 
30 1.74 .05 .06 | .06 | .07 | .07 | .09 | .10 | .13 17 | .21 .33 | .46 | .59 | .69 
36 1.67 .05 06 6.06  .07 | .07 | .09 |.11 ¿14 | .19 | .23 | (.37 | .51 .64 | .75 
48 1.59 .05 .06 | .06 | .07 —.08 | .10 | .11 16 | .21 27 (421.58  .72 | .82 
60 1.53 .05 06 6.06 .07 | .08 | .10 1.12 .17 |.23 .29 | .47 6.63  .7/7 | .87 
90 1.46 .05 .06 1,07 .08 | .09 | .11 131 .19/| .26  .34 | .54 | .71 .84 | .92 
120 1.43 .05 .06 | .07 —.08 | .09 | .11 .14 | .21 .28 | .37 | .58 | .76 | .88 | .95 
120 2 19.49 .05 .05 | .05 | .05 | .05 | .05 .05 | .05 .06 | .06 | .06 | .07 | .07 | .07 
3 8.55 .05 .05 | .05 | .05 | .05 | .05 .05 | .06 | .06 | .06 | .07 | .07 | .08 | .09 
4 5.66 .05 .05 | .05 | .05 | .05 | .05 .06 | .06 | .06 | .07 — .07 | .08 | .09 | .10 
5 4.40 .05 .05 | .05 | .05 | .05 | .06 | .06 | .06 | .06 | .07 | .08 | .09 | .10 | .11 
6 3.70 .05 .05 | .05 | .05 | .05 | .06 | .06 | .06 | .07 | .07 | .08 | .10 | .11 ¿13 
7 3,27 .05 .05 11.05.05 | .05|.06 .06  .06 | .07 —.07  .09 .10 | .12 | .14 
8 2.97 .05 .05 | .05 | .05 .06 | .06 | .06 | .07 | .07 | .08 | .09 | .11 A A 
10 2.58 .05 .05 | .05 | .05 | .06 | .06 | .06 | .07 | .08 | .08 | .10 | .12 | .15 | .17 
12 2.34 .05 .05 | .05 | .05 | .06 | .06 | .06 | .07 | .08 | .09 | .11 .14 | .17 | .20 
16 2.06 .05 .05 | .05 | .06 | .06 | .06 | .07 | .08 | .09 | .10 | .13 | .16 | .20 | .24 
20 1.90 .05 .05 | .05 | .06 | .06 | .06 | .07 | .08 | .09 | .10 | .14 | .18 | .23 | .28 
24 1.79 .05 .05 | .05 | .06 —.06 | .07 | .07 | .08 | .10 | .11 «15 [| .20 | .26 | .32 
30 1.68 .05 .05 | .06 | .06 | .06 | .07 | .07 | .09 | .10 | .12 | .17 | .23 | .30 | .37 
36 1.61 .05 .05 | .06 | .06 | .06 | .07 | .08 | .09 | .11 .13|.19 | .26 | .33 | .41 
48 1.52 .05 .05 | .06 | .06 | .06 | .07 | .08 | .10 | .12 | .15 | .22 | .30 | .40 | .49 
60 1.47 .05 .05 | .06 | .06 | .07 | .08 | .09 | .11 131.16 | .25 | .34 | .45 | .55 
90 1.39 .05 .05 | .06 | .06 | .07 | .08 | .09 | .12 .15 | .19 | .30 | .42 | .54 | .66 
120 1.35 .05 05 1.06 .07 |.07 |..08 |—.10 | .13 7 Zi .33 1.47 | .60 | .72 


Tablas estadísticas 539 
TABLA E. Distribución F no central (a =.01) 
F Parámetro de no centralidad A 
gh | glo | crítica 5 1 2 3 4 6 8| 12 | 16 | 20 | 30 | 40 | 50] 60 
1 2 98.50 | .01 | .02 | .03 | .04 | .05 | .07 | .09 | .12 .16 .19| .27 | .34 | .40 | .46 
3 34.12 | .02 | .02 1.04 | .06 | .08 | .11 | .15 | .23 | .31 | .38 | .54 | .67 | .76 | .83 
4 | 21.20 .02 | .03|.05 | .07 | .10 | .16 | .22 | .33 | .45 | .55 | .74 | .86 | .92 | .96 
5 16.26 | .02 | .03 | .06 | .09 | .12 | .19 | .27 | .42 | .55 | .66 | .85 | .94 | .97 | .99 
6 13.75.02 1.04 | .07 | .10 .14 | .22 | .31 | .48 | .63 | .74 | .91  .97 | .99 
7 12.25 | .02 | .04 | .07 | .11 | .16 | .25 | .35 | .53  .68 | .79 | .94 | .98 1 
8 11.26 | .02 1.04 | .08 | .12 | .17 | .27 | .38 | .57 | .72 | .83 | .95 | .99 1 
10 | 10.04 | .02 | .04 | .08 | .13 | .19 | .30 | .42 | .62 | .77 | .87 | .97 1 1 
12 9.33 | .03 1.04 | .09|.14 .20 | .32 | .45 | .66 | .80 .90  .98 1 1 
16 8.53 .03 .05 .10 ¿15 .22 .35 .48 .70 .84 .92 .99 1 1 
20 8.10 1.03 | .05 | .10 | .16 | .23 | .37 | .51 | .73|.86  .94 | .99 1 1 
24 7.82 | .03 | .05 | .10 | .17 | .24 | .38 | .52 | .74 | .87  .94 | .99 1 1 
30 7.56 | .03 | .05 | .11 | .17 | .25 1.40 | .54 | .76 | .88 | .95 1 1 1 
36 7.40 | .03 | .05 | .11 | .18 | .25 1.41 1.55 | .77 | .89 | .95 1 1 1 
48 7.19 | .03 | .05 | .11 | .18 | .26 .42 | .56 | .78 | .90  .9% 1 1 1 
60 7.08 | .03 | .05 | .12 | .19 | .26 .42 | .57 | .79 | .91  .96 1 1 1 
90 6.93 | .03 1.06 | .12 .19 .27 | .43 | .58 | .80 | .91 | .97 1 1 1 
120 | 6.85 | .03 | .06 | .12 | .19 .27 | .44 | .58 | .80 | .91 | .97 1 1 1 
2 2 99.00 | .01 | .01 | .02 | .02 | .03 | .04 | .05 | .07 .09 .10 | .15 | .19 | .23 | .27 
3 30.82 | .01 | .02 | .03 | .03 | .04 | .06 | .08 | .13 | .17 | .22 | .33 | .43 | .52 | .60 
4 18.00 | .01 | .02 | .03 | .04 | .06 | .09 | .12 | .19 .26 .34 | .51 | .65 | .75 | .83 
5 13.27 | .02 | .02 | .04 | .05 | .07 | .11 | .15 | .25 | .35 | .45 | .65 | .79 | .88 | .93 
6 10.92 .02 .02 .04 .06 .08 13 .19 .30 .42 .54 .75 .88 .94 .97 
7 9.55 | .02 1.02 | .04 | .07 | .09 | .15 | .21 | .35 | .48 | .60 | .81 | .92  .97 | .99 
8 8.65 .02 .03 .05 .07 .10 .16 .24 .39 .53 .66 .86 .95 .98 .99 
10 7.56 | .02 | .03 | .05 | .08 | .11 | .19 | .27 | .45 | .60 | .73 | .91 | .97 | .99 
12 6.93 | .02 1.03 |.06 .09 .12 | .21 | .30 | .49 | .65 | .78 | .94 | .99 1 
16 6.23 | .02 1.03 |.06 .10 .14 | .24 | .34 | .55 | .71 | .83 | .96 | .99 1 
20 5.85 | .02 | .03 | .07 | .10 | .15 | .26 | .37 | .58 | .75 | .86 | .97 1 1 
24 5.61 | .02 | .03 1.07 | .11 | .16 | .27  .39 | .61 | .77 | .88 | .98 1 1 
30 5.39 | .02 | .04 | .07 | .12 | .17 | .28 | .41 | .63 | .79 | .89 | .98 1 1 
36 5.25 | .02 | .04 | .07 | .12 | .17 | .29  .42 | .65 | .81 | .90 | .99 1 1 
48 5.08 | .02 | .04 | .08 | .12 | .18 | .31 .44 | .66 | .82 | .91 | .99 1 1 
60 4.98 | .02 | .04 | .08 | .13 | .18 | .31 | .45 | .68 .83 | .92 | .99 1 1 
90 4.85 | .02 1.04 | .08 .13 | .19|.32 | .46  .69 | .84 | .93 | .99 1 1 
120 | 4.79 | .02 | .04 | .08 | .13 | .19 | .33 | .47 | .70 | .85 | .93 | .99 1 1 
3 2 99.17 | .01 | .01 | .02 | .02 | .02 | .03 | .04 | .05 .06 .07 | .10 | .13 | .16 | .19 
3 29.46 | .01 | .01 | .02 | .03 | .03 | .04 | .06 | .09 | .12 | .15 | .23 | .31 | .38 | .45 
4 16.69 | .01 | .02 | .02 | .03 .04 | .06 | .08 | .13 | .18 | .24 | .37 | .50 | .60 | .69 
5 12.06 | .01 | .02 | .03 | .04 | .05 1.08 | .11 1.17  .25 1.32 | .50 | .65 | .77 | .85 
6 9.78 | .01 1.02 | .03 | .04 | .06 | .09 | .13 | .22 | .31 | .40 .61 | .76 | .86 | .92 
7 8.45 | .01 | .02 | .03 | .05 | .06 | .10 | .15 | .25 | .36 | .47 | .69 | .84 | .92 | .96 
8 7.59 | .02 | .02 | .03 | .05 | .07 | .12 | .17 | .29  .41 | .53 | .75 | .89 | .95 | .98 
10 6.55 | .02 | .02 | .04 | .06 | .08 | .14 | .20 | .34 | .48 | .6l | .83 | .94 | .98 | .99 
12 5.95 .02 .02 .04 .06 .09 .15 .23 .38 .54 .67 .88 .96 .99 
16 5.29 | .02 | .03 | .05 | .07 | .10 | .18 .26  .44 | .61 | .74 | .92 | .98 1 
20 4.94 | .02 1.03 |.05 .08 .11 | .20 | .29 | .48 | .65 | .78 | .95 | .99 1 
24 4.72 | .02 1.03 |.05 .08 .12 | .21 | .31  .51 | .68 | .81 | .96 | .99 1 
30 4.51 | .02 | .03 | .05 | .09 | .13 | .22 | .33 | .54 | .71 | .83 | .97 1 1 
36 438 | .02 1.03 | .06 .09 .13 | .23|.34 | .56 | .73 | .85 | .97 1 1 
48 422 | .02 1.03 .06 .10  .14 | .24 | .36  .58 | .75 | .87 | .98 1 1 
60 4.13 | .02 1.03 |.06 .10 .14 | .25 | .37 | .59 | .77 | .88 | .98 1 1 
90 4.01 | .02 1.03 |.06 .10 | .15 | .26 | .38 | .61 | .78 | .89 | .99 1 1 
120 | 3.95 | .02 | .03 | .06 | .10 | .15 | .27 | .39  .62 | .79 .900 | .99 1 1 


Fuente: Elaboración propia 


540 Tablas Estadisticas 


F Parámetro de no centralidad A 
gl; gl», crítica 5 1 2 3 4 6 8 12 16 20 30 40 50 60 
4 2 99.25 .01 .01 .01 ¿02 | .02 .02 .03 | .04 | .05 | .06 | .08 101.13 .15 
3 28.71 .01 .01 ¿02 | .02 | .03 .04 | .05 | .07 —.09 | .11 17 .23 29 35 
4 15.98 .01 .01 .02 | .03 | .03 .05 .06 .10 | .14 | .18 | .29 .39 .49 —.58 
5 11,39 .01 .02 | .02 .03 | .04 | .06 .08 | .13| .19  .25 | .40 .54 ¿06 | 75 
6 9.15 .01 02 |(.03 03 | .05 .07 1.10 | .16  .24 | .32 | .50 .66 .78 —.86 
7 7.85 .01 .02 | .03 .04 | .05 .08 | .11 .19 | .28 | .38 | .59 «275 .85 .92 
8 7.01 ¿01 ¿02 (1.03  .04 |.06 | .09 | 1.13 | ,.22 | .33 43 | 6.65 .81 .90 .95 
10 5.99 .01 02 |(.03 | 05 |.06 |.1] .16 | .27 | .39 | .51 ¿73 .89 .95 .98 
12 5.41 .01 02 1.03 6.05 |.07 | .12 8 0.31 .45 | .58 | .81 .93 .98 | .99 
16 4.77 .02 | .02 .04 | .06 | .08 | .14 | .21 .37 | .52 | .66 | .88 .96 .99 1 
20 4.43 .02 | .02 .04 | .06 | .09 —.16 | .23 | .41 57 | ¿91 .98 1 1 
24 4.22 .02 | .02 1.04 | .07 | .10 .17 | .25 | .44 | .61l .74 | .93 .99 1 1 
30 4.02 ¿02 | .02 | .05 6.07 (1.10  .,18 | .27 | 47 |(.64 | .78 || .95 .99 1 1 
36 3.89 .02 1.03 | .05 | .07 | .11 .19|.29| 49 .66 | .80 | .96 .99 1 1 
48 3.74 .02 | ,.03 (.05  .08 | .12 20. [| .30 | .51 .69 1.82 | .9%6 .99 1 1 
60 3.65 .02 1.03 |.05|.08 | .12 ¿21 ¿32 0353 | YI .83 | .97 1 1 1 
90 3.53 .02 1.03 | .05 | .09 | .13 22 33 155 |./3|.85 | .98 1 1 1 
120 3.48 .02 | .03 .05 | .09 | .13 .23 34 .56 | .74 | .86 | .98 1 1 1 
5 2 99.30 .01 .01 .01 .02 | .02 ¿02 .03 .03 | .04 | .05 | .07 .09 0.12 
3 28.24 .01 .01 .02 | .02 | .02 ¿03 .04 1.05 | .07 | .09 | .14 .19 .24 .29 
4 15.52 ¿91 .01 ¿02 | .02 | .03 .04 1.05 | .08 | .11 .14 1.23 32 41 .49 
5 10.97 .01 .01 ¿02 |.03 | .03 .05 06 |. <10| 5. «200 | 33 45 57 | .66 
6 8.75 .01 .02 | .02 6.03 6.04 | .06 |.08 | .13 | .19 .25 | .42 57  .69 | .79 
7 7.46 ¿01 .02 | .02 1.03 | .04 | .06 —.09 | .16 | .23 | .31 .50 .66 .78 | .87 
8 6.63 .01 .02 | .02 | .03 | .05 ¿207 (10 | .18 | .26 | .33 | .57/ «13 .85 .92 
10 5.64 .01 .02 | .03 .04 | .05 .09 1 .13| .22 .33 | .44 | .67 .83 .92 .96 
12 5.06 .01 .02 .03/|.04 .06 | .10 | .14 | .26 | .38 | .50 | .74 .89 .95 .98 
16 4.44 01 02 1.03 05 |.07 |.12 A 45.59 | .83 .94 .98 1 
20 4.10 .01 .02 | .04 .05 | .08 | .13 .20 1.35 | .50 | .64 | .87 .96 .99 1 
24 3.90 .02 | .02 .04 | .06 | .08 .14 | .21 38.54 | .68 | .90 .97 6.9 1 
30 3.70 .02 | .02 .04 | .06 | .09 | .15 .23 | .41 1538 | .72 | .92 .98 1 1 
36 3.57 .02 | .02 .04 | .06 | .09 .16 | .24 | 43 .60 | .74 | .93 .99 1 1 
48 3.43 .02 | .02 | .04 | .07 | .10  .17 .26 | 46  .64 | .78 | .95 .99 1 1 
60 3.34 .02 | .02 | .04 | .07 | .10 .18 | .27 | 48  .66 | .79 | .96 .99 1 1 
90 3.23 .02 | .02 | .05 | .07 | .11 19 |.29| 50 .68 .82 | .97 1 1 1 
120 3.17 ¿02 | .02 |(.05 .08 |.11 .20 1.30 | .51 70.83 | .97 1 1 1 
6 2 99.33 .01 .01 .01 .01 .02 .02 .02 .03 | .04 | .04 | .06 | .07 .09 .10 
3 27.91 .01 .01 .02 | .02 | .02 .03 .03 —.05 | .06 | .08 |.12 | .16 20.24 
4 15.21 ¿01 .01 202 | .02 | .02 .03 04 07 | .09 | 12 | .19 | .2/ 34.42 
5 10.67 .01 .01 .02 | .02 | .03 ¿204 | .05 | 09 .12 1.16 | .27 |.38 49 | .58 
6 8.47 .01 .01 ¿02 | .03 |.03 .05 ¿F- | 11 ¿16 | 21 35 | .49 62 ás 
7 7.19 .01 ¿02 |(.02 6.03 |.04 | .05 .08 1.113 | .19| 26 | .43 | .59 ral .81 
8 6.37 .01 ¿02 | .02 6.03 |.04 | .06 |.09 .15 | .22 ¿30 | .50 | .66 .79  .87 
10 5.39 ¿01 02 |(.02  .03 | .05 ¿07 | 11 18 (1.28 .37 | 6:60 | .77 .88 .94 
12 4.82 01 .02 | .03 .04 | .05 .08 1 .12| .22 .32 | 43| .68 | .84 .93 .97 
16 4.20 .01 ¿02 (.03 6.04 (1.06 | .10 | .15 | .27 | .40. .52 | .77 | .91 .97 —.99 
20 3.87 .01 02 (6.03 1.05 | .07 | .11 .17  .30 1.45 | 58  .83 | .94 .98 1 
24 3.67 .01 02 1.03 | 05 |.07 |.,12 .18 | .33 | 48 | .62 | .86 | .96 .99 1 
30 3.47 .01 .02 | .03|.05|.08 | .13 .20 1.36 1.52 | .67 (1.89 | .97 .99 1 
36 3.35 .01 .02 .04 | .06 —.08 | .14 | .21 38 (355 70 | .91 .98 1 1 
48 3.20 .02 | .02 | .04 .06 | .09 | .15 .23 6.41 .59 1.73 | .93  .99 1 1 
60 3.12 .02 | .02 .04 | .06 | .09 .16 | .24 | .43 | .61l .75  .94 | .99 1 1 
90 3.01 .02 | .02 | .04 | .07 | .09  .17 .26 | 46  .64 | .78 | .95 | .99 1 1 
120 2.96 .02 | .02 1.04 | .07 | .10 .18 | .27 | 47 .65 | .79| .96 | .99 1 1 


Tablas estadisticas 


541 


F Parámetro de no centralidad 4 
gh gl, crítica 2 1 2 3 4 6 8 12 16 20 30 40 50 60 
7 2 99.36 .01 .01 .01 .01 .02 | .02 .02 .03 | .03 .04 | .05 .07 .08  .09 
3 27.67 .01 .01 .01 .02 ¿02 | .02 .03 .04 — .05 7 | 10.1). 13 7 | 21 
4 14.98 .01 .01 .02 | .02 .02 | .03 .04 | .06 | .08 | .10 | .16 | .23 30.36 
5 10.46 .01 .01 ¿02 02 .03 1.04 | .05  .07 | .10 | .14 | .23 | .33 .43 ade 
6 8.26 .01 .01 .02 | .02 .03 | .04 | .06 | .09 | .13 .18 | .30 | .43 55 .65 
7 6.99 .01 .01 .02 | .03 .03 | .05 .07 | .11 16 | .22 TN .65 15 
8 6.18 .01 .01 ,.02 —.03 16.03  .05 .07 1 .13|.19 .26 | .43 | .60 «23 .82 
10 5.20 .01 .02 .02 | .03 .04 1.06 | .09  .16 | .24 | .32 54 | .71 .83 .91 
12 4.64 .01 .02 ¿02 —.03 .04 | .07 | .10  .18 | .28 | .38 | .62 .79 .90 | .95 
16 4.03 .01 .02 03 "04 |.05 .09 | .13 231.35 | 47 | .72 | .88 .95 .98 
20 3.70 .01 .02 .03 | .04 | .06 | .10 | .15 .26 1.40 | .53 .79 | .92 .97 | .99 
24 3.50 .01 .02 .03 1.04 | .06 | .11 .16 1 .29/| 44  .57 | .82 .94 .98 1 
30 3.30 .01 .02 .03 | .05 | .07 | .12 .18 1.32 | .48 | .62 .86 | .96 .99 1 
36 3.18 .01 .02 .03 | .05 .07 | .12 .19 [| .34 | .51 .65 .88 | .97 .99 1 
48 3.04 .01 .02 .03 | .05 .08 | .13 .21 37.54 | .69 | .91 .98 1 1 
60 2.95 .01 .02 .04 1.06 | .08 .14 | .22 39 (1.57 |. .92 | .98 1 1 
90 2.84 .02 | .02 .04 | .06 | .08 | .15 .23 421.60 | .75 .94 | .99 1 1 
120 2.79 .02 | .02 .04 1.06 | .09 .16 | .24 | .433 | .62 .76 | .95 .99 1 1 
8 2 99.37 .01 .01 .01 .01 .01 .02 .02 | .02 | .03 .03 | .05 .06 .07 | .08 
3 27.49 .01 .01 .01 .02 .02 | .02 .03 .04 — .05 .06 | .09 | .12 5 .18 
4 14.80 .01 .01 02 02 | .02 03 .03 .05 .07 .09 | .14 | .20 26. | 32 
5 10.29 .01 .01 .02 | .02 .02 | .03 .04  .06 | .09 .12 | .20 | .29 38 | .46 
6 8.10 .01 .01 .02 | .02 .03 | .04 | .05 .08 | .11 .15 1.26 | .38 49 | .59 
7 6.84 .01 ¿91 02 Dl .03 1.04 | .06 .09 | .14 | .19 | .32 | .46 59.69 
8 6.03 .01 .01 .02 | .02 .03 | .05 .06 | .11 16 1.22 | .38 | ¿54 DT | TT 
10 5.06 .01 .01 ¿02 —.03 .04 | .06 | .08  .14 | .21 .28 —.48 | .66 .79 | .88 
12 4.50 .01 .02 ¿02.03 .04 1.06 | .09 .16 | .24 | .34 | .56 | .74 .86 | .93 
16 3.89 .01 .02 .02 | .03 05 6.08 | .11 20 | .31 42 .67 | .84 .93 .97 
20 3.56 .01 .02 .03 | .04 | .05 | .09 | .13 .23|.36 | 48 | .74 | .89 26.99 
24 3.36 .01 .02 .03 | .04 | .06 [| .09 .14 | .26 | .39 | .53 .79 | .92 .98 | .99 
30 31% .01 .02 .03 | .04 | .06 | .10 | .16 | .29 | .43 .57 | .83 .95 .99 1 
36 3.05 .01 .02 .03 | .05 .06 | .11 ¿73 46 | .61 .86 | .96 .99 1 
48 2.91 .01 .02 03 05 | .07 6.12 .18 1 .34| .50 .65 | .89 | .97 .99 1 
60 2.82 .01 .02 .03 | .05 .07 | .13 .20 | .36 | .53 .68 | .90 | .98 1 1 
90 2.12 .01 .02 .03 | .05 .08 1.14 | .21 39.56 | .71 .92 .99 1 1 
120 2.66 .01 .02 .04 1.06 | .08 .14 | .22 | 40  .58 | .73 .93 | .99 1 1 
9 2 99.39 .01 .01 .01 .01 .01 .02 .02 .02 | .03 .03 .04 | .05 .06 | .07 
3 27.35 .01 .01 .01 .02 .02 | .02 .02 .03 | .04 | .05 .08 | .10 ,13 16 
4 14.66 .01 .01 .01 .02 02 | .03 .03 .04 .06 | .08 | .12 17 .23 .28 
5 10.16 .01 .01 .02 | .02 .02 | .03 04 1.06 .08. | .10 .18 .25 .33 41 
6 7.98 .01 .01 .02 | .02 .02 | .03 .04 | .07 | .10 | .13 23 .34 44 | 0.54 
yá 6.72 .01 .01 .02 1.02 | .03 .04 | .05 .08 .12 | .16 | .29 | .41 ¿33 .64 
8 5.91 .01 .01 .02 | .02 .03 1.04 | 06 .10 | .14 | .19  .34 | .49 .62 2 
10 4.94 .01 .01 02 | .03 .03 | .05 07 (12 | .18 .25 .43 .60 .74 | .84 
12 4.39 .01 .01 .02 1 .03|.04 .06 | .08 | .14 | .22 .30. | 51 .69 .82 .90 
16 3.78 .01 .02 ¿02 .03 .04 | .07 | .10 | .18  .28 | .38 | .62 | .80 91 .96 
20 3.46 .01 .02 02.03 05 6.08 | .11 .21 32 .44 —.70 | .86 .95 .98 
24 3.26 .01 .02 .03 | .04 | .05 | .08 | .13 231.36 | 48 | .75 .90 .97 | .99 
30 3.07 .01 .02 .03 | .04 | .05 | .09  .14 | .26 | .40 | .53 .80 | .93 .98 .99 
36 2.95 .01 .02 .03 | .04 | .06 10 1 .15/| .28 | .43 57 1.83 | .95 .99 1 
48 2.80 .01 .02 .03 1.04 | .06 | .11 AZ | 3 .47 | .6l .86 | .96 .99 1 
60 22 .01 .02 ¿03 6.05 07.12 .18 1 .33| 49 .64 | .88 | .97 .99 1 
90 2.61 .01 .02 .03 | .05 .07 | .13 .19 | .36 | .53 .68 | .91 .98 1 1 
120 2.56 .01 .02 .03 | .05 .07 | .13 .20 | .37 | .55 .70 | .92 .98 1 1 


542 Tablas Estadisticas 


F Parámetro de no centralidad A 

gl; gl, crítica 3 1 2 3 4 6 8 12 16 20 30 40 50 60 
10 Pa 99.40 .01 .01 .01 .01 .01 .02 .02 .02 | .03|.03 | .04 | .05 .06  .07 
3 27.23 .01 .01 .01 .01 .02 .02 .02 .03 | .04 | .05 | .07 | .09 12 .14 
4 14.55 .01 .01 .01 .02 | .02 .02 .03 .04 | .05 | .07 | .11 5 20. .25 
5 10.05 .01 .01 .01 .02 | .02 .03 .03 1.05 | .07 | .09 |,16 | .22 ¿30.37 
6 7.87 .01 .01 202 | ..02 | .02 .03 .04 1.06 | .09 | .12  .20 | .30 40.49 
7 6.62 .01 .01 .02 | .02 | .02 .03 .D5 6.07 | ,1] 15 (,.25 | .37 49 —.59 
8 5.81 .01 .01 .02 | -.02 | .03 .04 1 .05/|.08  .13 | .17 | .30 | .44 57.68 
10 4.85 .01 .01 ¿202 | .02 | .03 .04 | .06 | .11 16 | .22 | 39 | .56 .70  .80 
12 4.30 .01 .01 .02 | .03 | .03 .05 07 413 | 19 | 27 47 | 1.65 .78 | .87 
16 3.69 ¿91 .02 | .02 .03 | .04 | .06 —.09 | .16 | .25  .34 | .58 | .77 .88 .95 
20 3.37 .01 .02 | .02 | .03 | .04 | .07 —.10 | .19| .29 .40 | .66 | .83 .93 .97 
24 3.17 .01 .02 |(.02 6.03 |.05 .08 | .11 .21 321.451 .71 .87 .95 .98 
30 2.98 ¿01 .02 | .03 .04 | .05 .08 1 .13| .24 .36 | .50 | .76 | .91 .97 | .99 
36 2.86 .01 .02 1.03 | .04 | .05 .09 | .14 | .26 | .39  .53| .80 | .93 .98 1 
48 2.71 01 .02 | .03  .04 | .06 | .10 .15 | .29| 44  .58 | .84 | .95 .99 1 
60 2.63 01 .02 | .03 .04 | .06 | .11 16 | .31 46 | .61 .86 | .96 .99 1 
90 2.52 .01 ¿02 (.03 —.05 | .07 | .12 .18 | .33 | .50 | .65 | .89 | .98 1 1 
120 2.47 .01 .02 1.03 6.05 | .07 | .12 19  .35 | .52 | 67 (1.90 | .98 1 1 
12 2 99.42 .01 .01 .01 .01 .01 .01 .02 1.02 |.02|.03 | .03 | .04  .05 .06 
3 27.05 .01 .01 .01 .01 .02 .02 .02 .03|.03|.04 .06 | .08  .10 12 
4 14.37 .01 .01 .01 ¿02 | .02 .02 .03 —.03 | .05 | .06 |.09 | .13  .16 ¿21 
5 9.89 .01 .01 .01 ¿02 |.02 .02 .03 .04 | .06 | .08  .13 | .18 | .24 31 
6 7.72 .01 .01 ¿01 02 |.02 .03 ¿203 6.05 |.07 | .10  .16 | .24. .33 41 
7 6.47 .01 .01 .02 | ¿02 | .02 .03 .04 1.06 | .09 | .12 | .21 30 | .41 .50 
8 5.67 .01 .01 ¿202 | .02 | .02 .03 .04 1.07 | .10| .14  .25 | .36 | .48 .59 
10 4.71 .01 .01 ¿D2 | .02 | .03 .04 | .05| .09 .13 | .18 | .32 | .47 | .61 2 
12 4.16 .01 .01 ¿02 | .02 |.03 ¿04 (06 | .10 .16 | .22 | .39 |.56 | .70 .81 
16 3.505 .01 .01 ¿02 | .03 | .03 ¿05 07 —.13 | 20 | .28 (6.50 | .69  .82 .91 
20 3.23 .01 .01 .02 | .03 .04 | .06 | .09 .15 | .24 | .34  .58 | .77 | .89 .95 
24 3.03 .01 .02 | .02 1.03 | .04 | .06 .09 | .17 | .27 .38 .64  .82 | .92 .97 
30 2.84 .01 ¿02 |(.02 |—.03 |.04 | .07 |(.11 220 | .31 43 —.70 | .87 | .95 .98 
36 2.72 .01 02 (6.02 .03 |.05 .08 | .12| .22 .34 | .47 | .74 | .90 | .97 .99 
48 2.58 .01 .02 | .03 .04 | .05 .08 .13| .24 .38 .52| .79 .9 | .98 1 
60 2.50 .01 .02 | .03 .04 | .05 .09 1.14 | .26 | .41 55.82 | .94  .99 1 
90 2.39 .01 .02 | .03 .04 | .06 | .10 .15 | .29| 45 .60 .86 .96 | .99 1 
120 2.34 .01 .02 | .03 .04 | .06 | .10  .16 | .31 47 61.62 | .87 —.97 | .99 1 
16 2 99.44 .01 .01 .01 .01 .01 .01 .01 .02 .02 | .02 | .03 | .03 | .04 .05 
3 26.83 .01 .01 .01 .01 .01 .02 .02 .02 | .03|.03 .04 | .06  .07 .09 
4 14.15 ¿91 .01 .01 .01 .02 .02 .02 .03|.04 | .04  .07 | .09  .12 .15 
5 9.68 .01 .01 .01 .01 .02 ¿02 02 ¿03 | .04 | .06 |(.09 | .13 17 .22 
6 752 .01 .01 .01 .02 | .02 .02 .03 .04 | .05 | .07 .12 | .17 | .23 .30 
7 6.28 .01 .01 .01 .02 | .02 .02 .03 .05 .06 | .08 .14 | .22  ,29 37 
8 5.48 .01 .01 .01 02 |.02 .03 ¿03 6.05 | ¿07 | .10 |.17 .26  .36 45 
10 4.52 .01 .01 .02 | .02 | .02 .03 .04 6.06 | .09 | ,.13 | .23 | .35 47 .58 
12 3.97 .01 .01 202 | .02 | .02 .03 .04 —.07 | .11 15 | ,28 | 43  .56 .68 
16 Ea .01 .01 .02 | .02 | .03 .04 | .05| .09 .14 | .20 | .38  .55 | .70 .82 
20 3.05 .01 .01 .02 | .02 | .03 .04 | .06 | .11 17 1 .25| 45 | .65 .79 .89 
24 2.85 .01 .01 202 | .02 | .03 ¿05 7 132 | 20 | .29 | ¿51 | .85 .93 
30 2.66 .01 .01 ¿02 | .03 | .03 .05 .08 | .15 | .23 | .33 | .58 | .78 | .90 .96 
36 2.54 .01 .01 .02 | .03 |(.04 .06 |.09 .16 | .26 | 36 | .63 |.82 ¿93 .97 
48 2.40 ¿01 .02 | .02 .03 | .04 | .07 .10 .19| 30 .42 | .69 .87 | .95 .99 
60 23d .01 .02 | .02 .03 | .04 | .07 | .11 .20 1.32 .455 | .73 .90 | .97 .99 
90 2.21 .01 .02 (.02 6.03 | .05 .08 | .12 | .23| 36 .50 | .78 | .93 | .98 1 
120 2.15 .01 .02 | .02 | .04 | .05 ¿08 (| .13|.24 (,.39 1.53 | .81 .94 | .99 1 
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F Parámetro de no centralidad A 

gh gl», crítica 25 1 2 3 4 6 8 12 16 20 30 40 50 60 
20 2 99.45 .01 .01 .01 .01 .01 .01 .01 .02 61.02 |.02 | .02 | .03 .03 —.04 
3 26.69 .01 .01 ¿01 .01 .01 .01 02 |(.02 .02 |.03  .04 | .05 .06 | .07 
4 14.02 .01 .01 .01 .01 .01 .02 .02 | .02 | .03| .04  .05 | .07 —.09 | .11 
5 9.55 .01 .01 .01 .01 .02 | .02 .02 .03 | .04 | .04  .07 | .10 .13 | .17 
6 7.40 .01 .01 .01 .01 ¿02 | .02 .02 .03| .04 | .05  .09 | .13 18 | .23 
7 6.16 .01 .01 .01 .01 .02 | .02 .03 .04 | .05 | .06  .11 .16 ||.22 | ,29 
8 5.30 .01 .01 .01 02 1.02 | .02 03.04 .06 | .07 6.13 | .20 6.27 | .35 
10 4.41 .01 .01 .01 02 |—.02 | .03 03 (1.05 07 |—JN10 417 |.27 | 1.37 | 47 
12 3.86 .01 .01 .01 02 6.02 |.03 .04 1.06 | .08 | .12 | .22 | .33 A5 0.57 
16 3.26 .01 .01 .02 1.02 | .02 | .03 .04 .07 | .11 16 | .29 | .45 59 .72 
20 2.94 .01 .01 .02 |.02 | ..03 |.04 .05 | .09 | .13 | .19| .36 .54 | .69 81 
24 2.74 .01 .01 .02 1.02 | .03 .04 | .06 | .10 .15 | .22 | 42 | .61 76 87 
30 2.55 .01 .01 .02 1.02 | .03 .04 | .06 | .11 .18 .26 1.48 .68 | .83 | .92 
36 2.43 .01 .01 .02 1.02 | .03 | .05 .07 1.13 .20| .29 .53 | .74  .87 | .94 
48 2.28 .01 .01 .02 1.03 | .03 | .05 .08 .15 | .24| 34 .60 | .80 .92 | .97 
60 2.20 .01 .01 .02 1 .03|.04 .06 | .09 | .16 .26 | .37 | .65  .84 | .94 | .98 
90 2.09 .01 .02 .02|.03 .04 | .06 | .10  .19 | .30 | .43 | .71 .89 | .96 | .99 
120 2.03 .01 .02 .02 | .03 .04 | .07 | .10 .20 | .32| 45 | .74 | .91 .97 —.99 
24 2 99.46 .01 .01 .01 .01 .01 .01 .01 .01 02 | .02 | .02  .03 ¿03 03 
3 26.60 .01 .01 .01 .01 .01 .01 .02 .02 | .02 | .02 .03|.04  .05 | .06 
4 13.93 .01 .01 .01 .01 .01 .02 .02 .02 | .03| .03 .04 | .06 .07 | .09 
5 9.47 .01 .01 .01 .01 .01 .02 02 |(.02 .03 | .04  .06 | .08 |.11 13 
6 7.31 .01 .01 .01 .01 .01 .02 .02 .03 | .04 | .04  .07 | .10  .14 | .18 
7 6.07 .01 .01 .01 .01 .02 | .02 .02 .03| .04 | .05  .09 | .13 Jd8  .23 
8 5.28 .01 .01 .01 .01 02 | .02 02 (.03 | .05 | .06 10 | .16 | .21 .28 
10 4.33 .01 .01 .01 02 6.02 | .02 .03 .04 | .06 | .08 | .14 | .21 .29 .38 
12 3.78 .01 .01 .01 ¿02 |.02 | 02 03 (1.05 | 07 | 1.09 .17 |.26 | 6.37 | 47 
16 3.18 .01 .01 .01 02 —.02 | 03 04 (.06 .09 | —.12 .23/|.36 |—.50  .62 
20 2.86 .01 .01 .02 1.02 | .02 | .03 .04 (1.07 | .11 15 | .29 | .45 .60  .72 
24 2.66 .01 .01 .02 1.02 | .02 | .03 .05 .08 | .12| .18 | .34 | .52 .67 — .80 
30 2.47 .01 .01 02 | .02 | ..03 |.04 .05 | .09  .15 |.21 .40 | .60 | .75 | .86 
36 2.35 .01 .01 .02 1.02 | .03 .04  .06 | .10 .16 | .24 | 45 | .65 .81 .90 
48 2.20 .01 .01 ¿02 1.02 | .03 | ¿05 07 (12 .19 | 1.28 52 | .73 .87 —.94 
60 2.12 .01 .01 .02 1.02 | .03 |.¿05 07 (13 | .22 | .31 .57 | .78 | .90 | .96 
90 2.00 .01 .01 .02 1 .03|.03 | .06 | .08 | .16 .25 | .37| .64  .84 | .94 | .98 
120 1.95 .01 .01 .02 1 .03|.04 .06 | .09 | .17 .28 | .39| .68  .87 | .96 | .99 
30 2 99.47 .01 .01 .01 .01 .01 .01 .01 .01 .02 | .02 | .02 | .02 .03 | .03 
3 26.50 .01 .01 .01 .01 .01 .01 .01 .02 | .02 | .02 | .03 | .03 .04 | .05 
4 13.84 .01 .01 .01 .01 .01 .01 .02 | .02 | .02 | .03 | .04 | .05 .06 | .07 
5 9.38 .01 .01 .01 .01 .01 .02 .02 | .02 | .03 | .03 | .05 | .06 | .08 | .10 
6 7.23 .01 .01 .01 .01 .01 .02 .02 | .02 | .03 | .04 | .06 | .08 | .10 | .13 
Ed 5.99 .01 .01 ¿01 .01 .01 .02 ¿02 (.03 ¿03 | .04  .07 |.10 |.13 .17 
8 3.20 .01 .01 .01 .01 .01 .02 .02 .03| .04 | .05  .08 | .12 16 |..21 
10 4.25 .01 .01 .01 .01 .02 | .02 ¿02 (.03 04 |.06.  .10 | .15 .22 | .29 
12 3.70 .01 .01 .01 .01 ¿02 | ¿02 .03 | .04 | .05 | .07 | .13 | .20 | .28 | .36 
16 3.10 .01 .01 .01 02 |—.02 | .02 .03 | .05 | .07 | .09 | .17 | .27 | .39 | .50 
20 2.78 .01 .01 .01 .02 |.02 | .03 .03 | .05 | .08 | .11 .22 | .34 | .48 | .60 
24 2.58 .01 .01 .01 .02 | .02 | .03 .04 | .06 | .09 | .13 | .26 | .41 .56 | .69 
30 2.39 .01 .01 .02 1.02 | .02 |.03 .04 .07 | .11 ¿16.31 48 1.64 | .77 
36 2.26 .01 .01 .02 | .02 | .02 | .03 .05 | .08 | .13 | .18 | .36 | .54 | .71 .83 
48 2.12 .01 .01 .02 1.02 | .03 .04 | .05| .09  .15 | .22 | .42 | .63 .79 | .89 
60 2.03 .01 .01 .02 1.02 | .03 .04 | .06 | .11 .17 | .25 | .47 | .69 | .84 | .93 
90 1.92 .01 .01 ¿02 | .02 | .03 | .05 .07 | .13 | .20 | .30 | .55 | .76 | .90 | .96 
120 1.86 .01 .01 .02 | .02 | .03 | .05 .07 1.14 | .22 | .32 | .59 | .80 | .92 | .97 
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F Parámetro de no centralidad A 

gl, gl, crítica 25 1 2 3 4 6 8 12 16 20 30 40 50 60 
40 2 99.47 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .02 1.02 .02 | .02 
3 26.41 .01 .01 .01 .01 .01 .01 .01 .01 .02 1.02 | .02 | .03 | .03 | .04 
4 13.75 .01 .01 .01 .01 .01 .01 .01 .02 .02 1.02 | .03 | .04 | .04 | .05 
5 9.29 .01 .01 .01 .01 .01 .01 .02 | .02 02 61.02 | .03 | .05 | ..06 | —.07 
6 7.14 .01 .01 .01 .01 .01 .01 .02 | .02 .02 1 .03|.04 | .06 | .07 | .09 
vá 5.91 .01 .01 .01 .01 .01 .02 ¿02 | ¿02 103 61.03 | .05 | ¿07 | .09 (6.12 
8 5.12 .01 .01 .01 .01 .01 .02 .02 | .02 .03 .04 | .06 | .08 | .11 .14 
10 4.17 .01 .01 .01 .01 .01 .02 .02 | .03 .03 1.04 | .07 | .10 | .15 | .19 
12 3.62 .01 .01 .01 .01 .01 .02 ¿02 | ¿03 .04 |).05|.09 | .13 | .18 | .25 
16 3.02 .01 .01 .01 .01 82  .02 .02 | .04 |(.05 .06 .12 .18 | .26 | .35 
20 2.69 .01 .01 .01 ¿02 (¿02 |.02 .03 | .04 .06 .08 | .15  .24 | .34 | .44 
24 2.49 .01 .01 .01 ¿202 (.02 | .02 ¿03 | .05 .07 |.09|.18 | .28 | .40 | .52 
30 2.30 .01 .01 .01 ¿02 (¿02.03 .03 | .05 .08 | .11 21 35 | .49 | .62 
36 2.18 .01 .01 .01 .02 (.02 | .03 .04 [| .06 | .09 | .13| .25 .40 | .55 | .69 
48 2.02 .01 .01 02 61.02 | .02 | ¿053 .04 | .07 | .11 AS | .31 49 | .65 | .78 
60 1.94 .01 .01 ¿02 —.02 | .02 | .03 .04 [| .08 |).12 1 .18| .35 1.55 | .72 | .84 
90 1.82 .01 .01 .02 .02 | .03|.04 .05 | .09 | .15 .22 | .43  .64 | .81 .91 
120 1.76 .01 .01 .02 .02 1 .03|.04 .06 .10 | .17 7.24 | .48 .69 | .85 | .94 
60 2 99.48 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 ¿02 | ¿02 | .02 
3 26.32 .01 .01 .01 .01 .01 .01 .01 .01 .01 .02 | .02 |(.02 | .02 |.03 
4 13.65 .01 .01 .01 .01 .01 .01 .01 .01 ¿02 1.02 | 02 | .03 | .03 | .04 
5 9.20 .01 .01 .01 «0 .01 .01 .01 .02 .02 1.02 | .02 | .03 | .04 | .05 
6 7.06 .01 .01 .01 .01 .01 .01 .01 .02 .02 1.02 | .03 | .04 | .05 | .06 
Y 5.82 .01 .01 .01 .01 .01 .01 .01 .02 ¿02 1.02 |.03 | .04 | .05 |.07 
8 5.03 .01 .01 .01 .01 .01 .01 .02 | .02 .02 1 .03|.04 | .05|.06 | .08 
10 4.08 .01 .01 .01 .01 .01 .01 .02 | .02 .02 1 .03|.04 | .06 | .08 | .11 
12 3.54 .01 .01 .01 .01 .01 .02 .02 | .02 ¿03 16.03 | .05 | ¿07 | .10 |.14 
16 2.93 .01 .01 .01 .01 .01 .02 .02 | .02 .03 1.04 | .07 | .10 | .15 | .20 
20 2.61 .01 .01 .01 .01 .01 .02 .02 | .03 .04 | .05| .08 | .13 | .19  .26 
24 2.40 .01 .01 .01 .01 02  .02 .02 | .03 04 61.06 | .10 | .16 |.23 6.31 
30 2.21 .01 .01 .01 .01 .02 | .02 .02 | .03 ¿05 (1.07 | .12 | 20 | 29 |.39 
36 2.08 .01 .01 .01 ¿00 02  .02 .03 | .04  .05 | .07 | .14 | .23| .34 | .46 
48 1.93 .01 .01 .01 ¿02 (.02  .02 .03 | .04 | .07 | .09| .18 | .30 | .43 | .57 
60 1.84 .01 .01 .01 ¿02 (| .02 | .02 .03 | .05 ¿07 11 21 35 | .50 | .64 
90 1.72 .01 .01 .01 ¿02 (.02 .03 .04 | .06 | .09 | .13 | .27  .455 | .62 | .76 
120 1.66 .01 .01 .01 ¿02 (102% |.03 .04 | .07 | .11 15 | .32 (51 .68 | .82 
120 2 99.49 .01 .01 .01 .01 .01 ¿Ol .01 .01 .01 .01 .01 .01 .01 .01 
3 26.22 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 .02 | .02 | .02 
4 13.56 .01 .01 .01 .01 .01 ¿0 .01 .01 .01 .01 02 .02 .02 | .02 
5 9.11 .01 .01 .01 .01 .01 .01 .01 .01 .01 .01 ¿02 (1.02 02 | .02 
6 6.97 .01 .01 .01 .01 .01 .01 .01 .01 .01 ¿02 | ¿02 |(.02 .02 |.03 
7 5.74 .01 .01 .01 .01 .01 .01 .01 .01 .01 ¿02 | .02 (,.02 1.03 |./03 
8 4.95 .01 .01 .01 ¿01 .01 .01 .01 .01 .02 1.02 | .02 | .03 | .03 | .04 
10 4.00 .01 .01 .01 .01 .01 .01 .01 .01 .02 1.02 | .02 | .03 | .04 | .04 
12 3.45 .01 .01 .01 .01 .01 .01 .01 .02 .02 1.02 | .03 | .03 | .04 | .05 
16 2.84 .01 .01 .01 .01 .01 .01 .01 .02 .02 1.02 | .03 | .04 | .06 | .07 
20 2.52 .01 .01 .01 .01 .01 .01 .01 .02 .02 1.02 | .04 | .05 | .07 | .09 
24 2.31 .01 .01 .01 .01 .01 .01 .02 | .02 .02 1 .03|.04 | .06 | .08 | .11 
30 2.31 .01 .01 .01 .01 .01 .01 02 | ¿02 .03 1 .03|.05 | .07 | .10 | .14 
36 1.98 .01 .01 .01 .01 .01 .02 ¿02 | ¿02 ¿03 61.03 | .06 | .08 | 12 |.17 
48 1.82 .01 .01 .01 .01 .01 .02 ¿02 | .02 .03 1.04 | .07 | .11 J6 |.22 
60 1.73 .01 .01 .01 .01 .01 .02 .02 | .03 .04 1.05 | .08 | .13 | .20 | .27 
90 1.60 .01 .01 .01 .01 ¿202 | .02 ¿02 | ¿03 .04 |) .06 | .11 18 | 27 | .38 
120 1.53 .01 .01 .01 .01 02  .02 .02 | .03 05 1.07 (0.13 |.22|.33 1.45 
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TABLA F. Coeficientes de polinomios ortogonales 

Polinomio 1 2 3 4 5 6 7 8| 9 ye? vEc* 
Lineal —1 0 1 1.4142 
Cuadrático 1 —2 1 2.4495 
Lineal 301 =1 1 3 20 | 4.4721 
Cuadrático 1 —1 1 1 4 2.0000 
Cúbico —1 3 —3 1 20 4.4721 
Lineal —2 | 10) 1 2 10 3.1623 
Cuadrático 2 —1 —2 -1 2 14 3.7417 
Cúbico =1 2 ol -2 1 10 3.1623 
Cuártico 1 4 6 —4 1 70 8.3666 
Lineal —=5 3 —1 1 3 5 70 8.3666 
Cuadrático 51 — 41 -4 1 5 84 | 9.1652 
Cúbico |. 5 7 4| 44 | 7 5 180 | 13.1464 
Cuártico 1 3 21 3 1 28 | 5.2915 
Lineal | -3| -2| —1 0 1 3 28 | 5.2915 
Cuadrático 5 0 3 4 =3 5 84 9.1652 
Cúbico 1 l | 0| 1 1 1 6| 2.4495 
Cuártico 3| —7 1 6 tl ol 154 | 12.4097 
Lineal | 27| 3 | -3| -—1 1 3 51 7 168 | 12.9615 
Cuadrático 7 y =3 =5 =5 -3 1 7 168 | 12.9615 
Cúbico | 7? 5 7 ales l ll <=) 7 264 | 16.2481 
Cuártico dl a 9 91 3|-13| 7 616 | 24.8193 
Lineal | 4| 3| -—2| —1 0 1 21 3l 4 60 | 7.7460 
Cuadrático | 29 | 8 1720-17 8| 7|28| 2772 | 52.6498 
cúbica] =% y 38 9 o| —9| -13| _7| 14| 990 | 31.4643 
cura | 20 9| 18 9| -11| -21 | 14 | 2002 | 44.7437 


Fuente: elaboración propia. 
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TABLA G. Potencia observada con efectos aleatorios (a =.05) 


F F efecto 


gh crítica 2 3 4 5 6 7 8 10 15 | 30 | 60 | 90 | 120 


gl 
2 | 1851 | 09 | 13 |.16  .19 | .22 | .25 | .27 | .31 |] .38 | .51 | .63 | .69 | .73 
3 | 113 | .11 | .16 | .21  .25 | .28 | .32 | .34 | .39 | .47 | .60 | .71 | .76 | .79 
4 | 7.71 | .12 | .18|.24 | .28 | .32 .35 | .38 | .43 | .51 | .64 | .74 | .78 | .81 
5 6.61 .13 | .20 | .26 | .30 | .34 | .38 | .41 45 | .54 | .66 | .75 | .80 .82 
6 | 599 |.13 | .21 |.27  .32 | .36 | .39 | .42 | .47 | .55 | .67 | .76 | .81 | .83 
7 | 559 | .14 | .21 | .28  .33 | .37 | 40 | .43 | .48 | .56 | .68 | .77 | .81 | .84 
8 | 532 | .14 | .22 | .28  .33 | .37 | 41 | .44 | .49 | .57 | .68 | .77 | .81 | .84 
9 | 512 | .14 | .22 | .29  .34 | 38 | .41 | .44 | .49 | .57 | .69 | .78 | .82 | .84 
10 | 496 | .15 | .23 | .29 | .34 | .38 | .42 | .45 | .50 | .58 | .69 | .78 | .82 | .84 
12 4.75 15 | .23 | .30 | 35 | .39 | .43 | .46 | .50 | .58 | .70 | .78 | .82 .85 
15 | 454 | .15 | .24 | 30 | .36 | .40 | .43 | .46 | .51 | .59 | .70 | .79 | .83 | .85 
20 | 435 | .16 | .24 | .31 | .36 | 40 | .44  .47 | .52 | .60 | .71 | .79 | .83 | .85 
30 | 4.17 | .16 | .25 | .32 | .37 | 41 | 45.48 | .52 | .60 | .71 | .79 | .83 | .85 
60 | 4.00 | .16 | .25 | .32 | .37 | .42 | .45  .48 | .53 | .61 | .72 | .80 | .83 | .86 
120 | 3.92 | .16 | .26 | .32 | .38 | .42 | .46  .49 | .53 | .61 | .72 | 80 | .84 | .86 


2 2 19.00 | .10 | 14 | .17 —.21  .24 | .27 | .30 | .34 | .44 | .61 | .76 | .83 | .86 
9.55 12 | .18 | .24 | .29 | .34 | .38 | .42 | .48 | .59 | .75 | .86 | .90 | .93 
6.94 13 | .21 | .29 | 35 | .40 | .45 | .49 | .55 | .66 | .80 | .89 | .93 | .94 
5.79 15 | .24 | .32 | .39 | .44 | .49 | .53 | .59 | .70 | .83 | .91 | .94 | .95 
5.14 16 | .26 | .34 | .41 | .47 | .52 | .56 | .62 | .72 | .85 | .92 | .94 | .96 
4.74 16 | .27 | .36 | .43 | .49 | .54 | .58 | .64 | .74 | .86 | .92 | .95 | .96 
4.46 17 | .28 | .37 | .45 | .51 | .55 | .59 | .66 | .75 | .86 | .93 | .95 | .96 
9 4.26 .18 | .29 | .38 | .46 | .52 | .57 | .60 | .67 | .76 | .87 | .93 | .95 | .97 
10 4.10 .18 | .30 | .39 | .47 | .53 | .57 | .61 | .67 | .77 | .87 | .93 | .96 | .97 
12 3.89 .19 | 31 | .41 | .48 | .54 | .59 | .63 | .69 | .78 | .88 | .94 | .96 | .97 
15 3.68 .20 | .32 | .42 | .50 | .55 | .60 | .64 | .70 | .79 | .89 | .94 | .96 | .97 
20 3.49 .21 | .33 | .43 | .51 | .57 | .61 | .65 | .71 | .79 | .89 | .94 | .96 | .97 
30 3.32 21 | .34 | .45 | .52 | .58 | .63 | .66 | .72 | .80 | .90 | .95 | .96 | .97 
60 3.15 22 | .36 | .46 | .54 | .59 | .64 | .68 | .7/3 | .81 | .90 | .95 | .97 | .97 
120 3.07 22 | 36 | .47 | .54 | .60 | .65 | .68 | .7/4 | .82 | .90 | .95 | .97 | .97 


3 2 1916 | 10 | 14 | 18 .21 .25 | .28 | .31 | .36 | .47 | .66 | .82 | .88 | .92 
9.28 12 |.19| .25 | .31 | .36 | .41 | .45 | .52 | .65 | .82 | .92 | .95 | .97 
6.59 14 | .23 | .31 | .39 | .45 | .50 | .55 | .62 | .74 | .88 | .95 | .97 | .98 
5.41 16 | .26 | .36 | .44 | .50 | .56 | .60 | .67 | .78 | .91 | .96 | .98 | .99 
4.76 .17 | .29 | .39 | .47 | .54 | .60 | .64 | .71 | .81 | .92 | .97 | .98 | .99 
4.35 .18 | .31 | .42 | .50 | .57 | .62 | .67 | .74 | .83 | .93 | .97 | .98 | .99 
4.07 .19 | .32 | .43 | .52 | .59 | .64 | .69 | .75 | .84 | .94 | .98 | .99 | .99 
9 3.86 20 | .34 | .45 | .54 | .61 | .66 | .70 | .77 | .85 | .94 | .98 | .99 | .99 
10 3.71 20 | 35 | .46 | .55 | .62 | .67 | .71 | .78 | .86 | .94 | .98 | .99 | .99 
12 3.49 .21 | .36 | .48 | .57 | .64 | .69 | .73 | .79 | .87 | .95 | .98 | .99 | .99 
15 3.29 .22 | .38 | .50 | .59 | .66 | .71 | .75 | .80 | .88 | .95 | .98 | .99 | .99 
20 3.10 .23 | .40 | .52 | .61 | .68 | .73 | .76 | .82 | .89 | .96 | .98 | .99 | .99 
30 2.92 .25 | .42 | .54 | .63 | .69 | .74 | .78 | .83 | .90 | .96 | .99 | .99 | .99 
60 2.76 .26 | .44 | .56 | .65 | .71 | .76 | .79 | .84 | .91 | .96 | .99 | .99 1 
120 2.68 .27 | 45 | .57 | .66 | .72 | .77 | .80 | .85 | .91 | .97 | .99 | .99 1 
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TABLA G (continuación) 


FP F efecto 
gl crítica 2 3 4 5 6 7 8 10 15|30|60|90|120 
4 19.25 | .096 | .14 | .18 | .22 | .25 | .28 | .31 | .37 | .48 | .68 | .85 | .91 94 


gl 
2 
3 9.12 122 | .19 | .26 | 32 | .38 .43  .48 | .55 | .69 | .86 | .95 | .97 .98 
4 6.39 .143 | .24 | .33 | .41 48 | .53 .58 | .66 | .79 | .92 | .97 | .99 .99 
5 5.19 .162 | .28 | .38 | 47 | 54 —.60 | .65 | .73 | .84 | .94 | .98 | .99 
6 453 | .177 | .31 | 42 | 52 | .59 | .65 | .70 | .77 | .87 | .96 | .99 | .99 
F 4.12 .190 | .33 | .45 | 55 | .62 .68 | .73 | .80 | .89 | .96 | .99 
8 3.84 .201 35 | .48 | .58 | .65 | .71 75 | .81 .90 | .97 | .99 
9 3.63 .210 | .37 | .50 | .60 | .67 | .72 | .77 | .83 | .91 .97 | .99 
10 | 348 |.218 | .38 | 51 | .61 | .68 | .74 | .78 | .84 | 91 | .97 | .99 
12 | 326 | .230 | .41 | 54 | .64 | .71 .76 | .80 | .86 | .92 | .98 | .99 
15 3.06 .244 | 43 | .56 | .66 | .73  .78 | .82 | .87 | .93 | .98 | .99 
20 2.87 .260 | .45 | .59 | .69 | .75 —.80 | .84 | .88 | .94 | .98 1 
30 2.69 276 | .48 | .62 | .71 .7171 (| 82 85 | .90 | .95 | .98 1 
60 2.53 .295 | .50 | .64 | .73 | .79 —.84 | .87 | .91 .95 | .99 1 
120 | 2.45 | .304 | .52 | .65 | .74 | .80 | .84 | .87 | .91 | .96 | 99 | 1 


5 2 19.30 10 |.14 | .18 | .22 | .25 | .29 | .32 | .38 | .49 | .70 | .87 | .93 | .96 
9.01 .12 | .20 | .27 | 33 | 39 | .44 | .49 | .57 | .71 | .89 | .97 | .99 | .99 
6.26 .15 | .25 | .34 | .43 | .50 | .56 | .61 | .69 | .82 | .94 | .99 | .99 
5.05 .17 | .29 | .40 | .50 | .57 | .64 | .69 | .76 | .87 | .96 | .99 
4.39 .18 | .33 | .45 | .55 | .63 | .69 | .74 | .81 | .90 | .97 | .99 
3.97 .20 | .35 | .48 | .59 | .66 | .72 | .77 | .84 | .92 | .98 
3.69 .21 .38 | .51 | .62 | .69 | .75 | .80 | .86 | .93 | .98 
9 3.48 .22 | .40 | .54 | .64 | .72 | .77 | .81 | .87 | .94 | .99 
10 3.33 .23 | .41 | .56 | .66 | .73 | .79 | .83 | .88 | .94 | .99 
12 3.11 .25 | .44 | .59 | .69 | .76 | .81 | .85 | .90 | .95 | .99 
15 2.90 .26 | .47 | .61 | .71 | .78 | .83 | .87 | .91 | .96 | .99 
20 2.71 .28 | .50 | .65 | .74 | .81 | .85 | .88 | .92 | .97 | .99 
30 2.53 .30 | .53 | .68 | .77 | .83 | .87 | .90 | .93 | .97 | .99 
60 2.37 .33 | .56 | .71 | .79 | .85 | .89 | .91 | .94 | .98 1 
120 2.29 .34 | .58 | .72 | .81 | .86 | .90 | .92 | .95 | .98 1 


6 2 19.33 10 |.14 | .18 | .22 | .26 | .29 | .32 | .38 | .50 | .71 | .88 | .94 | .97 
8.94 .12 | .20 | .27 | .34 | .40 | .45 | .50 | .59 | .73 | .90 | .98 | .99 
6.16 15 | .25 | .35 | .44 | 51 | .58 | .63 | .72 | .84 | .96 | .99 
4.95 .17 | .30 | .42 | .52 | .60 | .66 | .71 | .79 | .90 | .98 
4.28 .19 | .34 | .47 | .57 | .65 | .72 | .77 | .84 | .92 | .98 
3.87 .20 | .37 | .51 | .62 | .70 | .76 | .80 | .87 | .94 | .99 
3.58 .22 | .40 | .54 | .65 | .73 | .79 | .83 | .89 | .95 | .99 
9 3.37 .23 | .42 | .57 | .67 | .75 | .81 | .85 | .90 | .96 | .99 
10 3.22 .24 | .44 | .59 | .70 | .77 | .82 | .86 | .91 | .96 | .99 
12 3.00 .26 | .47 | .62 | .73 | .80 | .85 | .88 | .93 | .97 | .99 
15 2.79 .28 | .50 | .66 | .76 | .82 | .87 | .90 | .94 | .98 1 
20 2.60 .30 | .54 | .69 | .79 | .85 | .89 | .92 | .95 | .98 1 
30 2.42 .33 | .57 | .72 | .81 | .87 | .91 | .93 | .96 | .99 1 
60 2.25 .36 | .61 | .76 | .84 | .89 | .92 | .94 | .97 | .99 1 
120 2.18 .37 | .63 | .77 | .85 | .90 | .93 | .95 | .97 | .99 1 
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TABLA G (continuación) 


F F efecto 
gh | glo | crítica 2 3 4 5 6 7 8 10 15 | 30 60 | 90 | 120 
7 2 19.35 .10 14 | .18 | .22 .26 .29 .32 .38 .50 .72 .89 .95 .97 
3 8.89 12 .20 .27 | 34 | .41 46 .51 .60 .74 .92 .98 .99 1 
4 6.09 15 .26 | 36 | .45 | .53 | .59 | .65 | .73 | .86 | .97 | .99 1 1 
5 4.88 17 31 43 .53 .61 .68 .73 .81 .91 .98 1 1 1 
6 4.21 .19 35 | .48 | .59 .68 .714  .79 .86 .94 .99 1 1 1 
7 3.79 .21 .38 | .53 | .64 | .72 | .78 | .83 | .89 | .96 | .99 1 1 1 
8 3.50 .23 41 | .56 | .67 | .75 | .81 | .85 | .91 | .96 | .99 1 1 1 
9 3.29 .24 .44 | .59 .70 .78 .83 .87 .92 .97 1 1 1 1 
10 3.14 .25 46 | .62 .72 .80 .85 .89 .93 .98 1 1 1 1 
12 2.91 .27 .49 .65 | .76 .83 .87 | .91 .94 .98 1 1 1 1 
15 2.71 .29 .53 | .69 | .79 | .85 | .90 | .92 | .96 | .99 1 1 1 1 
20 2.51 .32 57 | .73 .82 .88 .92 .94 .97 .99 1 1 1 1 
30 2.33 .35 .61 | .76 | 85 | .90 | .93 | .95 | .97 | .99 1 1 1 1 
60 2.17 .39 .65 | .80 | .88 | .92 | .905 | .96 | .98 | .99 1 1 1 1 
120 2.09 41 .68 | .82 | .89 | .93 | .95 | .97 | .98 | .99 1 1 1 1 
8 2 19.37 .10 14 | .18 | .22 .26 .29 .32 .38 .51 .73 .90 .95 .98 
3 8.85 12 .20 .28 | .35 .41 47 0.52 .61 .76 .93 .99 1 1 
4 6.04 15 .26 .36 .46 .54 —.60 .66 15 .87 .97 1 1 1 
5 4.82 17 31 .44 | .54 | .63 .70 .75 .83 .93 .99 1 1 1 
6 4.15 .20 .36 | .50 | .61 | .69 | .76 | .81 | .88 | .95 | .99 1 1 1 
7 3.73 .21 .39 .54 | .66 .714 80 .85 .90 .97 1 1 1 1 
8 3.44 .23 .43 .58 | .70 .78 .83 .87 .92 .97 1 1 1 1 
9 3.23 .25 45 | .61 | .73 | .80 | .86 | .89 | .94 | .98 1 1 1 1 
10 3.07 .26 .48 | .64 | .75 .82 .87 | .91 .95 .98 1 1 1 1 
12 2.85 .28 .51 | .68 | .78 | .85 | .90 | .92 | .96 | .99 1 1 1 1 
15 2.64 31 55 | .72 .82 .88 .92 .94 .97 .99 1 1 1 1 
20 2.45 .34 .60 | .76 | .85 | .90 | .93 | .95 | .98 | .99 1 1 1 1 
30 2.27 .37 .64 | .80 .88 .92 .95 .97 .98 1 1 1 1 1 
60 2.10 41 .69 | .83 | 90 | .944 | .96 | .98 | .99 1 1 1 1 1 
120 2.02 .43 .72 .85 | .92 .95 .97 | .98 .99 1 1 1 1 1 
9 2 19.38 .097 | .14 | .18 | .22 .26 .29 .33 .39 .51 .74 .91 .96 .98 
3 8.81 .125 | .20 .28 | .35 .41 47 6.53 .61 .76 .93 .99 1 1 
4 6.00 .151 .26 .37 | .46 .54 .61 .67 .76 .88 .98 1 1 1 
5 4.77 .176 .32 45 | .55 .64  .71 .76 .84 .94 .99 1 1 1 
6 4.10 .197 | .36 .51 .62 WA 17 | 82 .89 .96 1 1 1 1 
7 3.68 .217 | .40 .56 .67 .76 .82 .86 .92 .97 1 1 1 1 
8 3.39 .235 | 44 | .60 | .71 | .79 | .85 | .89 | .94 | .98 1 1 1 1 
9 3.18 .250 47 | .63 .714 | .82 .87 | .91 .95 .98 1 1 1 1 
10 3.02 .264 | .49 .66 .717 84 | .89 .92 .96 .99 1 1 1 1 
12 2.80 .288 | .53 .70 .81 .87 | .91 .94 .97 .99 1 1 1 1 
15 2.59 317 | 58 | .74 | 84 —.90 |.93 | .905 | .988 | .99 1 1 1 1 
20 2.39 .350 | .62 | .78 | .87 | .92 .95 | .97 | .98 1 1 1 1 1 
30 2.21 .389 | .67 | 82 | 90 | .94  .96 .98 | .99 1 1 1 1 1 
60 2.04 .435 | .72 | 86 | 93 | .96 | .97 .98 | .99 1 1 1 1 1 
120 1.96 .461 | .75 | 88 | 94 | .96 .98 .99 | .99 1 1 1 1 1 
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TABLA G (continuación) 


F F efecto 
crítica 2 3 4 5 6 7 8 10 15 |30|60 | 90 | 120 


gh 


gl 
10 | 2 | 19.40 | .097 | .14 | .18 | 22 | .26 | .29 | .33 | .39 | .51 | .74 | .91 | .96 | .98 
3 | 879 |.125 | .20 | .28 | .35 | .42 | .48 | .53 | .62 | .77 | .94 | .99 
4 | 5.96 | .152 | .27 | .37 | .47 | .55 | .62 | .68 | .77 | .89 | .98 
5 | 474 | .177 | .32 | 45 | 56 | .65 | .72 | .78 | .85  .94 | .99 
6 4.06 .200 | .37 | .52 | .63 | .72 | .79 | .84 | .90 | .97 1 
7 3.64 .220 | .41 .57 | .69 | .77 | .83 | .88 | .93 | .98 1 
8 3.35 .239 | .45 | .61 .73 | .81 86 | .90 .9% | .98 1 
9 3.14 .255 | .48 | .65 | .76 | .84 | 89 | .92 | .96 | .99 1 
10 2.98 .270 | .50 | .68 | .79 | .86 | .90 | .93 | .97 | .99 1 
12 2.75 .296 | .55 | .72 | .82 | .89 | .93 | .95 | .98 | .99 1 
15 2.54 .326 | .59 | .76 | .86 | .91 94 | .96 .98 1 1 
20 2.35 .363 | .65 | .81 .89 | .94 | .96 | .97 | .99 1 1 
30 2.16 .406 | .70 | .85 | .92 | .95 | .97 | .98 | .99 1 1 
60 1.99 457 | .75 | .88 | .94 | .97 | .98 | .99 1 1 1 
120 1.91 .486 | .78 | .90 | .95 | .98 | .99 | .99 1 1 1 


12 2 19.41 | .097 | .14 | .18 | .22 | .26 | .30 | .33 | .39 | .52 | .75 | .92 | .97 | .99 
8.74 .125 | .21 | .28 | .36 | 42  .48 | .54 | .63 | .78 | .95 | .99 
5.91 .153 | .27 | .38 | .48 | .56 | .63 | .69 | .78 | .91 | .99 
4.68 .179 | .33 | 46 | .58 | .67 | .74 | .79 | .87 | .95 
4.00 .203 | .38 | .53 | .65 | .74 | .81 | .86 | .92 | .98 
3.57 .225 | 42 | .59 | .71 | .79 | .85 | .89 | .94 | .99 
3.28 .245 | .46 | .63 | .75 | .83 | .89 | 92 | .906 | .99 

9 3.07 .263 | .50 | .67 | .79 | .86 | .91 | .94 | .97 | .99 
10 2.91 .280 | .53 | .70 | .81 | .88 —.92 | .95 | .98 1 
12 2.69 .309 | .57 | .75 | .85 | .91 —.94 | .96 | .98 1 
15 2.48 .343 | .63 | .80 | .89 | 94  .96 | .98 | .99 1 
20 2.28 .385 | .68 | .84 | .92 | .96 —.98 | .99 | .99 1 
30 2.09 .436 | .74 | .88 | .94 | .97 | .98 | .99 á 1 
60 1.92 .497 | .80 | .92 | .96 | .98 | .99 1 1 1 
120 1.83 .533 | .83 | .93 | .97 | .99 | .99 1 1 1 


16 2 19.43 | .097 | .14 | .18 | .22 | .26 | .30 | .33 | .39 | .52 | .76 | .93 | .97 | .99 
8.69 .126 | .21 | .29 | .36 | 43 .49 | 55 | .64 | .80 | .96 
5.84 .155 | .27 | .39 | 49 | .58 | .65 | .71 | .80 | .92 | .99 
4.60 .182 | .34 | .48 | .59 | .69 | .76 | .82 | .89 | .97 
3.92 .208 | .39 | .55 | .68 | .77 | .83 | .88 | .94 | .99 
3.49 .232 | .44 | .61 | .74 | .82 | .88 | .92 | .96 | .99 
3.20 .254 | .49 | .67 | .79 | .86 .91 | .94 | .97 

9 2.99 .275 | 52 | .71 | 82 | .89 .93 | .96 | .98 
10 2.83 .294 | .56 | .74 | .85 | .91 | .95  .97 | .99 
12 2.60 .328 | .61 | .79 | .89 | .94 | .97 | .98 | .99 
15 2.38 .369 | .67 | .84 | .92 | .96 | .98 | .99 
20 2.18 .420 | .74 | .89 | .95 | .98 | .99 | .99 
30 1.99 .485 | .80 | .93 | .97 | .99 | .99 1 
60 1.82 .565 | .87 | .96 | .99 | .99 1 1 
120 1.73 .611 | .90 | .97 | .99 1 1 1 


Fuente: elaboración propia 
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TABLA H. Potencia observada con efectos aleatorios (a = .01) 


F F efecto 

gh | gl | crítica 2 3 4 5 6 7 8 10 15 | 30 60 | 90 | 120 
1 2 98.50 | .02 | .03 | .04 | .05 | .06 | .06 | .07 | .08 | .12 | .21 | .33 | .41 46 
3 34.12 | .03 | .04 | .06 | .08 | .10 | .11 | .13  .16 | .23 | .36 | .51 | .58 | .63 
4 21.20 .03 .06 | .08 | .11 .13 .16 .18 .22 .30 45 .58 | .65 .70 
5 16.26 .04 | .07 | .10 .13 .16 .19 .21 .26 .35 .49 .62 | .69 .73 
6 13.75 .04 | .08 | .11 15 .18 .21 .24 .29 .38 .52 .65 | .71 .75 
7 12.25 .04 | .08 | .12 .16 .20 .23 .26 31 .40 .54 .67 | .72 .76 
8 11.26 .05 | .09 .13 17.21 .24 | .27 .32 .41 .56 .68 | .73 17 
9 10.56 .05 | .09 14 | .18 .22 .25 .28 .33 .42 YA .68 | .74 17 
10 10.04 .05 | .10 14 | .18 .23 .26 .29 .34 .43 .58 .69 | .75 .78 
12 9.33 .05 | .10 15 | .20 24 6.27 | .30 .35 45 .59 70 | .75 .79 
15 8.68 .06 11 .16 .21 .25 .28 31 .37 .46 .60 YA] .76 .79 
20 8.10 .06 12 17 | .22 .26 .30 .33 .38 47 .61 12 | .T7 .80 
30 7.56 .06 12 .18 .23 .27 31 .34 .39 .48 .62 13 | .T7 .80 
60 7.08 .07 | .13 .19 .24 .28 .32 .35 .40 .49 .63 13 | .78 .81 
120 6.85 .07 | .13 .19 .24 —.29 .33 .36 .41 .50 .63 .74 | .78 .81 
2 2 99.00 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .09 | .13 | .23 | .38 | .48 | .55 
3 30.82 .03 .05 | .07 | .09 11 .13 15 .19 .27 .46 .64 | .73 .79 
4 18.00 | .03 | .06 | .09 | .13 .16 | .19 | .22 | .28 | .39 | .59 | .76 | .83 | .87 
5 13.27 .04 | .08 | .12 .16 .21 .24 .28 .35 47 .67 .81 .87 .90 
6 10.92 .05 | .09 14 | .19 .24  .29 .33 .39 .52 YA] .84 | .89 .91 
7 9.55 .05 | .10 16 | .22 .27 | .32 .36 .43 .56 .74 .86 | .90 .92 
8 8.65 .05 | .11 | .18 | .24 | .29 | .34 | .38 | .46 | .58 | .76 | .87 | .91 93 
9 8.02 .06 12 .19 .25 31 .36 .40 .48 .60 AT .88 | .92 .94 
10 7.56 .06 | .13 .20 .27 | 32 .38 .42 .49 .62 .78 .88 | .92 .94 
12 6.93 .07 | .14 | .22 .29 .35 .40 45 .52 .64 .80 .89 | .93 .94 
15 6.36 .07 | .16 | .24 | .31 37 42 47 .54 .66 .81 90 | .93 .95 
20 5.85 .08 | .17 | .26 | .33 | .39 | .45 | .49 | .57 | .68 | .82 | .91 | .94 | .95 
30 5.39 .08 | .18 | .27 | .35 | .42 | .47 | .52 | .59 | .70 | .84 | .91 | .94 | .96 
60 4.98 .09 | .20 | .29 | .38 | .44 | .50 | .54 | .61 | .72 | .85 | .92 | .95 | .96 
120 4.79 .10 .21 31 .39 45 .51 .55 .62 .73 .85 92 | .905 .96 
3 2 99.17 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .09 | .13 | .24 | .40 | .51 .59 
3 29.46 | .03 | .05 | .07 | .09 | .11 | .13 | .16 | .20 | .30 | .51 | .71 | .81 .86 
4 16.69 .03 .07 | .10 14 0.17 | .21 .25 31 .44 .67 .84 | .90 .93 
5 12.06 | .04 | .08 | .13 | .18 | .23 | .28 | .32 | .40 | .54 | .76 | .89 | .94 | .96 
6 9.78 .05 | .10 | .16 | .22 | .28 | .33 | .38 | .46 | .61 | .81 | .92 | .95 | .97 
7 8.45 .05 | .12 .19 .26 .32 37 —.43 .51 .66 .84 .93 | .96 .97 
8 7.59 .06 | .13 | .21 | .28 | .35 | .41 | .46 | .55 | .69 | .86 | .94 | .97 | .98 
9 6.99 .06 | .14 | .23 | .31 | .38 | .44 | .49 | .58 | .71 | .87 | .95 | .97 | .98 
10 6.55 .07 | 15 | .24 | 33 | 40 | .46 | .51 | .60 | .73 | .88 | .95 | .97 | .98 
12 5.95 .07 | .17 | .27 | .36 | .43 | .49 | .55 | .63 | .76 | .90 | .96 | .98 | .98 
15 5.42 .08 | .19 | .30 | .39 | .46 | .53 | .58 | .66 | .78 | .91 | .96 | .98 | .99 
20 4.94 .09 | .21 | .32 | .42 | .50 | .56 | .61 | .69 | .80 | .92 | .97 | .98 | .99 
30 4.51 10 | .23| 35 | 45 | .53 | .59 | .64 | .72 | .82 | .93 | .97 | .98 | .99 
60 4.13 .12 | .26 | .39 | 49 | .56 | .62 | .67 | .75 | .84 | .94 | .98 | .99 | .99 
120 3.95 12 | .27 | .40 | .50 | .58 | .64 | .69 | .76 | .85 | .94 | .98 | .99 | .99 


TABLA H (continuación) 
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F F efecto 
gh | gla | crítica 2 3 4 5 6 7 8 10 15 | 30 | 60 | 9 | 120 
4 2 99.25 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .09 | .14 | .25 | .41 | .53 | .61 
3 28.71 .03 .05 .07 | .09 .12 .14 .16 .21 31 .54 | .76 .85 .90 
4 15.98 .03 .07 —.10 .14 .18 .22 .26 .33 .48 | .72 .89 .94 .96 
5 1139 | .04 | 09 | 14 .19 .25 | .30 | .35 | .43 | .59 | .82 | .93 | .97 | .98 
6 9.15 .05 11 .18 .24 31 37 .42 .51 .67 | .86 | .95 | .98 .99 
7 7.85 .06 .13 .21 .28 .35 .42 .48 .57 .72 | .89 .97 | .98 .99 
8 7.01 .06 14 .23 .32 .39 .46 .52 .61 .76 | .91 .97 | .99 .99 
9 6.42 .07 | 16.26 | .35 | 43 | .49 | .55 | .65 | .79 | .92 | .98 | .99 | .99 
10 5.99 .07 | .17 | .28 | .37 | 45 | .52 | .58 | .67 | .80 | .93 | .98 | .99 | .99 
12 5.41 .08 .19 31 .41 .49 .56 .62 YA] .83 | .94 | .98 | .99 1 
15 4.89 .09 | .22| 34 | .45 | .53 | .60 | .66 | .74 | .86 | .95 | .99 | .99 1 
20 4.43 10 |.25|.38 | .49 | .58 | .65 | .70 | .78 | .88 | .96 | .99 1 1 
30 4.02 12 .28 .42 .53 .62 .68 .73 .81 90 | .97 | .99 1 1 
60 3.65 14 31 .46 .57 .66 .12 17 .83 .91 .97 | .99 1 1 
120 3.48 15 |.33|.48 | .60 | .68 | .74 | .78 | .85 | .92 | .98 | .99 1 1 
5 2 99.30 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .09 | .14 | .25 | .42 | .54 | .63 
3 28.24 .03 .05 .07 —.09 .12 .14 .16 .21 32 | .56 | .78 | .88 .92 
4 15.52 .04 —.07 | .11 .15 .19 .23 .27 .35 .50 | .76 .91 .96 .98 
5 10.97 | .04 | .09 | 15 .20 | .26 | .32 | .37 | .46 | .63 | .85 | .96 | .98 | .99 
6 8.75 .05|.11 1.18 | .26 | .33 | .39 | .45 | .55 | .71 | .90 | .97 | .99 | .99 
7 7.46 .06 .13 .22 .30 .38 45 .51 .61 77 | .93 .98 | .99 1 
8 6.63 06 1.15 | .25 | .34 | .43 | .50 | .56 | .66 | .81 | .94 | .99 | .99 1 
9 6.06 .07 | .17 | .28 | .38 | .47 | .54 | .60 | .70 | .83 | .95 | .99 1 1 
10 5.64 .08 | .18 | .30 | .41 | .50 | .57 | .63 | .73 | .85 | .96 | .99 1 1 
12 5.06 .09 .21 34 —.45 .54 .62 .68 T1 .88 | .97 | .99 1 1 
15 4.56 .10 .24 .38 .50 .59 .67 .72 .80 .90 | .98 1 1 1 
20 4.10 12 .28 .43 .55 .64 WA] .76 .84 .92 | .98 1 1 1 
30 3.70 .13|.32 | .48 | .60 | .69 | .75 | .80 | .87 | .94 | .99 1 1 1 
60 3.34 16 |.36 | .53 | .65 | .73 | .79 | .84 | .89 | .95 | .99 1 1 1 
120 3.17 .17 | .39 .56 .67 .15 .81 .85 .90 96 | .99 1 1 1 
6 2 99.33 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .10 | .14 | .25 | .42 | .55 | .64 
3 27.91 .03 .05 .07 | .09 .12 .14 AT .21 .33 | .57 | .80 .90 .94 
4 15.21 .04 —.07 | .11 15 .19 .24 .28 .36 52 | .78 | .93 .97 .99 
5 10.67 | .04 | .09 | .15 | .21 | .27 | .33 | .38 | .48 | .66 | .88 | .97 | .99 | .99 
6 8.47 .05 12 .19 .27 .34 .41 47 .58 .75 | .93 .98 | .99 1 
7 7.19 .06 14.23 .32 .40 .48 .54 .65 .81 .95 | .99 1 1 
8 6.37 07 | 16 | .27 | .36 | .45 | .53 | .60 | .70 | .84 | .96 | .99 1 1 
9 5.80 .07 | .18 | .30 | .40 | .50 | .58 | .64 | .74 | .87 | .97 | .99 1 1 
10 5.39 .08 .20 .32 .44 .53 .61 .67 17 .89 | .98 1 1 1 
12 4.82 .09 .23 37 —.49 .59 .66 .72 .81 .91 .98 1 1 1 
15 4.32 11 .26 .42 .54 .64 WA] 17 .85 .93 | .99 1 1 1 
20 3.87 12 31 47 —.60 .69 .76 .81 .88 95 | .99 1 1 1 
30 3.47 15 1.36 | .53 | .66 | .74 | .81 | .85 | .91 | .96 | .99 1 1 1 
60 3.12 .18 .41 .59 11 .79 .85 .88 .93 .97 1 1 1 1 
120 2.96 .19 44 .62 .74 .81 .86 .90 .94 .98 1 1 1 1 
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TABLA H (continuación) 


F F efecto 
gh | gl | crítica 2 3 4 5 6 7 8 10 15 | 30 60 | 90 | 120 
7 2 99.36 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .09 | .14 | .25 | .43 | .55 | .65 
3 27.67 .03 .05 | .07 | .09 12 14.17 .22 .33 .58 .82 | .91 .95 
4 14.98 .04 | .07 | .11 15 .20 .24 .28 37 .53 .80 .95 | .98 .99 
5 10.46 | .04 | .09 | 15 | .22  .28 | 34 | .40 | .50 | .68 | .90 | .98 | .99 1 
6 8.26 .05 | .12 .20 .28 .36 .43 .49 .60 11 .94 .99 1 1 
7 6.99 .06 | .14 | .24 | 34 | 42 | .50 | .57 | .68 | .83 | .96 | .99 1 1 
8 6.18 .07 | .17 | .28 | .38 .48 .56 .63 .73 .87 .97 1 1 1 
9 5.61 .08 | .19 31 .43 .52 .61 .67 I1 .90 .98 1 1 1 
10 5.20 .08 | .21 34 | .46 .56 .64  .71 .80 .91 .99 1 1 1 
12 4.64 .10 .24 | .39 .52 .62 .70 .76 .84 .94 .99 1 1 1 
15 4.14 11 .28 | .45 | .58 .68 .75 .81 .88 .95 .99 1 1 1 
20 3.70 .13 .33 .51 .64 —.74 | .80 .85 .91 .97 1 1 1 1 
30 3.30 .16 | .39 | .57 | .70 | .79 | 85 | .89 | .93 | .98 1 1 1 1 
60 2.95 19 | .45 | .64 | .76 | .84 | .89 | .92 | .95 | .98 1 1 1 1 
120 2.79 .21 .49 .67 | .79 .86 .90 .93 .96 .99 1 1 1 1 
8 2 99.37 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .10 | .14 | .25 | .43 | .56 | .65 
3 27.49 .03 .05 | .07 | .09 12 14.17 .22 .34 .59 .83 | .92 .96 
4 14.80 .04 | .07 | .11 .16 .20 .25 .29 37 .55 .82 .96 | .98 .99 
5 10.29 .04 | .10 .16 .22 .29 .35 .41 .51 .70 .91 .99 1 1 
6 8.10 .05 | .12 .20 .29 37 6.44 | .51 .62 .79 .95 .99 1 1 
7 6.84 .06 | .15 | .25 | .35 44 —.52 .59 .70 .85 .97 1 1 1 
8 6.03 .07 | .17 | .29 | .40 | .50 | .58 | .65 | .75 | .89 | .98 1 1 1 
9 5.47 .08 | .20 | .32 | .44 | .55 | .63 | .70 | .80 | .91 | .99 1 1 1 
10 5.06 .09 | .22 | .36 | .48 | .59 | .67 | .74 | .83 | .93 | .99 1 1 1 
12 4.50 .10 .25 | .41 .55 .65 .73 .79 .87 .95 .99 1 1 1 
15 4.00 12 .30 47 | .61 71 .78 .84 .90 .97 1 1 1 1 
20 3.56 .14 | 35 | .54 | .68 | .77 | .84 | .88 | .93 | .98 1 1 1 1 
30 3.17 17 | .42 .61 .714 | .82 .88 .91 .95 .99 1 1 1 1 
60 2.82 .21 .49 .69 .80 .87 | .91 .94 .97 .99 1 1 1 1 
120 2.66 .23 | .53 | .72 | 83 | .89 | .93 | .95 | .98 | .99 1 1 1 1 
9 2 99.4 .02 | .03 | .04 | .05 | .06 | .07 | .08 | .10 | .14 | .25 | .43 | .56 | .66 
3 27.3 .03 .05 | .07 | .10 12 15 17 .22 .34 .60 .84 | .93 .96 
4 14.7 .04 | .07 | .11 .16 .20 .25 .29 .38 .55 .83 96 | .99 1 
5 10.2 .04 | .10 .16 .23 .29 .36 .42 .52 71 .92 .99 1 1 
6 8.0 .05 | .12 .21 .29 .38 45 .52 .64 .81 .96 1 1 1 
7 6.7 .06 | .15 | .25 | .36 45 .53 .61 .12 .87 .98 1 1 1 
8 5.9 .07 | .18 | .30 | .41 | .51 | .60 | .67 | .78 | .91 | .99 1 1 1 
9 5.4 .08 | .20 | .34 | .46 | .57 | .65 | .72 | .82 | .93 | .99 1 1 1 
10 4.9 .09 | .22 | .37 | .50 | .61 | .69 | .76 | .85 | .95 | .99 1 1 1 
12 4.4 .10 .27 | 43 .57 | .68 .76 .81 .89 .96 1 1 1 1 
15 3.9 12 .32 .50 .64 .74 | .81 .86 .92 .98 1 1 1 1 
20 3.5 .15 | .38 | .57 | .71 | .80 | 86 | .90 | .95 | .99 1 1 1 1 
30 3.1 .18 | .45 | .65 | .78 | .86 | .90 | .93 | .97 | .99 1 1 1 1 
60 2.7 .23 .53 .72 .84 —.90 94  .96 .98 1 1 1 1 1 
120 2.6 .26 .57 | .76 .86 .92 .95 .97 .99 1 1 1 1 1 


Tablas estadísticas 553 


TABLA H (continuación) 


EF F efecto 
crítica | 2 3 4 5 6 7 8 10 | 15 | 30 | 60 | 90 | 120 


gl 


8l2 
10 2 99.40 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .10 | .14 | .25 | .43 | .56 | .66 

3 | 27.23 | .03 | .05 .07 .10 | .12 | .15 | .17 | .22 | .34 | .61 | .85 | .93 | .97 

4 | 1455 | .04 | .07 —.11  .16 | .20 | .25 | .30 | .38 | .56 | .84 | .97 | .99 

5 10.05 | .04 | .10 | .16 | .23 | .30 | .36 | .42 | .53 | .72 | .93 | .99 
6 7.87 .05 | .13 | .21 .30 | .38 | .46 | .53 | .65 | .82 | .97 
7 6.62 .06 | .15 —.26 | .37 | .46 | .55 | .62 | .73 | .88 | .98 
8 5.81 .07 | .18 .30 | .42 | .53 | .62 | .69 | .79 | .92 | .99 
9 | 5.26 | .08 | .21 | .35 | .48 | .58 | .67 | .74 | .84 | .94 | .99 
10 | 485 | .09 | .23 | .38 | .52 | .63 | .71 | .78 | .87 | 96 | 1 
12 | 430 | .11 | .27 | .45 | .59 | .70  .78 | .83 | .91 | .97 | 1 
15 3.80 .13 | .33 .52 | .66 | .76 | .83 | .88 | .94 | .98 1 
20 3.37 15 | .39 .60 | .74 | .83 | .88 | .92 | .96 | .99 1 
30 2.98 .19 | .47 —'.68 | .80 | .88 | .92 | .95 | .98 | .99 1 
60 | 263 | .24 | .56 | .76 | .87 | .92 | .95 | .97 | 99 | 1 1 
120 | 2.47 | .28 | .61 | .80 | .89 .94 | .96 | .98 | .99 | 1 1 


12 2 99.42 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .10 | .14 | .26 | .44 | .57 | .67 
27.05 | .03 | .05 | .07 | .10 | .12 | .15 | .17 | .22 | .35 | .62 | .86 | .94 | .97 
14.37 | .04 | .07 | 11 —.16  .21 | .26 | .30 | .39 | .57 | .85 | .98 | .99 
9.89 .05 | .10 | .16 | .23 | .30 | .37 | .44 | .55 | .74 | .95 | .99 
7.72 .05 | .13 | .22 | .31 | .40 | .48 | .55 | .67 | .85 | .98 
6.47 .06 | .16 | .27 | .38 | .48 | .57 | .64 | .76 | .90 | .99 
5.67 .07 | .19 | .32 | .44 | .55 | .64 | .72 | .82 | .94 | .99 
9 5.11 .08 | .22 | .36 | .50 | .61 | .70 | .77 | .86 | .96 
10 4.71 .09 | .24 | .40 | .55 | .66 | .75 | .81 | .89 | .97 
12 4.16 .11 | .29 | .47 | .62 | .73 | .81 | .87 | .93 | .98 
15 3.67 .13 | .35 | .55 | .70 | .80 | .87 | .91 | .96 | .99 
20 3.23 17 | 43 | .64 | .78 | .86 | .92 | .95 | .98 1 
30 2.84 .21 | .52 | .73 | .85 | .91 | .95 | .97 | .99 1 
60 2.50 .27 | .62 | .81 | .91 | .95 | .97 | .99 | .99 1 
120 2.34 31 | .67 | .85 | .93 | .97 | .98 | .99 1 1 


16 2 99.44 | .02 | .03 | .04 | .05 | .06 | .07 | .08 | .10 | .14 | .26 | .44 | .58 | .68 
3 26.83 | .08 | .05 | .07 | .10 | .12 | .15 | .17 | .23 | .35 | .63 | .88 | .95 | .98 
4 14.15 | .04 | .07 | 12 .16 | .21 | .26 | .31 | .40 | .59 | .87 | .98 
5 9.68 .05 | .10 | .17 | .24 | .31 | .38 | .45 | .57 | .77 | .96 
6 7.52 .06 | .13 | .22 | .32 | .42 | .50 | .58 | .70 | .87 | .99 
7 6.28 .07 | .16 | .28 | .40 | .51 | .60 | .68 | .79 | .93 
8 5.48 .08 | .20 | .34 | .47 | .59 | .68 | .75 | .86 | .96 
9 4.92 .09 | .23 | .39 | .53 | .65 | .74 | .81 | .90 | .97 
10 4.52 .10 | .26 | .43 | .59 | .70 | .79 | .85 | .92 | .98 
12 3.97 .12 | .32 | .52 | .67 | .78 | .86 | .90 | .96 | .99 
15 3.49 15 | .39 | .61 | .76 | .85 | .91 | .95 | .98 1 
20 3.05 .18 | .48 | .71 | .84 | .91 | .95 | .97 | .99 1 
30 2.66 .24 | .59 | .80 | .91 | .96 | .98 | .99 1 1 
60 2.31 .33 | .71 | .89 | .96 | .98 | .99 1 1 1 
120 2.15 .39 | .77 | .92 | .97 | .99 1 1 1 1 


Fuente: elaboración propia 


554 Tablas estadísticas 


TABLA |. Valores límite del estadístico Durbin Watson (a = .05) 


N q DW, DWs N q DW, DWs N q DW,  DWs 
6 2 0.610 1.400 15 2 1076 1.360 20 2 1201 1.410 
7 2 0.699 1.356 15 3 0.945 1.543 20 3 1.100 1.536 
7 3 0.467 1.896 15 4 0.813 1.750 20 4 0.997 1.676 
8 2 0.762 1.332 15 5 0.685 1.977 20 5 0.894 1.828 
8 3 0.559 1.777 15 6 0.561 2.219 20 6 0.791 1.990 
8 4 0.367 2.286 15 7 0.447 2.471 20 7 0.691 2.161 
9 2 0824 1.319 15 8 0.342 2.726 20 8 0.594 2.339 
9 3 0.629 1.699 15 9 0.250 2.978 20 9 0502 2.520 
9 4 0454 2.128 15 10 0.175 3.216 20 10 0.415 2.703 
9 5 0.295 2.588 16 2 1.106 1.370 21 2 1221 1419 
10 2 0.879 1.319 16 3 0.982 1.538 214 3 1.124 1.538 
10 3 0.697 1.641 16 4 0.857 1.727 214 4 1.026 1.669 
10 4 0.525 2.016 16 5 0.734 1.935 21 5 0.927 1.811 
10 5 0.376 2.413 16 6 0.614 2.156 21 6 0.828 1.963 
10 6 0.242 2.821 16 7 0.502 2.388 21-75-0781 2108 
11 2 0.927 1.324 16 8 0.398 2.624 21 8 0.637 2.289 
11 3 0.757 1.604 16 9 0.304 2.860 21 9 0546 2.460 
11 4 0.594 1.928 16 10 0.222 3.089 21 10 0.460 2.633 
11 5 0.444 2.283 17 2 1.132 1.381 22 2 1.239 1.428 
11 6 0315 2.644 17 3 1015 1.536 22 3 1.147 1.540 
11 7 0.202 3.004 17 4 0.896 1.710 22 4 1.052 1.663 
12 2 0.970 1.331 17 5 0.778 1.900 22 5 0.957 1.797 
12 3 0.812 1.579 17 6 0.664 2.104 22 6 0.862 1.939 
12 4 0.657 1.863 17 7 0554 2.317 22 7 0.768 2.090 
12 5 0511 2.176 17 8 0451 2.536 22 8 0.677 2.246 
12 6 0.379 2.506 17 9 0.356 2.756 22 9 0.588 2.407 
12 7 0.268 2.831 17 10 0.271 2.974 22 10 0.503 2.570 
12 8 0.171 3.149 18 2 1.157 1.391 23 2 1.256 1.437 
13 2 1.009 1.340 18 3 1.046 1.535 23 3 1.168 1.543 
13 3 0.861 1.562 18 4 0.933 1.696 23 4 1.077 1.659 
13 4 0.714 1.815 18 5 0.820 1.871 23 5 0.986 1.785 
13 5 0.574 2.094 18 6 0.709 2.060 23 6 0.894 1.919 
13 6 0.444 2.389 18 7 0.603 2.257 23 7 0.804 2.060 
13 7 0.327 2.692 18 8 0501 2.461 23 8 0.714 2.208 
13 8 0.230 2.985 18 9 0.407 2.667 23 9 0.628 2.359 
13 9 0.146 3.265 18 10 0.320 2.872 23 10 0.544 2.514 
14 2 1.044 1.350 19 2 1.180 1.401 24 2 1272 1.445 
14 3 0.905 1.550 19 3 1074 1.535 24 3 1.187 1.546 
14 4 0.766 1.778 19 4 0.966 1.685 24 4 1.101 1.656 
14 5 0.632 2.029 19 5 0.858 1.848 24 5 1.013 1.775 
14 6 0.505 2.295 19 6 0.752 2.022 24 6 0.924 1.901 
14 7 0.388 2.571 19 7 0.648 2.206 24 7 0.837 2.035 
14 8 0.285 2.847 19 8 0.549 2.396 24 8 0.750 2.174 
14 9 0.200 3.111 19 9 0.455 2.589 24 9 0.665 2.317 
14 10 0.127 3.360 19 10 0.368 2.783 24 10 0.584 2.464 


N =n? casos, q =n* parámetros, DW/;=límite inferior, DWs=límite superior 


Tablas estadísticas 555 


TABLA | (continuación) 


N q DW,  DWs N q DW,  DWSs N q DW,  DWSs 
25 2 1.287 1.453 30 2 1.352 1.489 35 2 1.401 1.519 
25 3 1.206 1.549 30 3 1.283 1.566 35 3 1.343 1.583 
25 4 1.122 1.654 30 4 1.213 1.649 35 4 1.283 1.652 
25 5 1.038 1.766 30 5 1.142 1.738 35 5 1.222 1.725 
25 6 0.952 1.886 30 6 1.070 1.832 35 6 1.160 1.802 
25 7 0.868 2.012 30 7 0.998 1.931 35 7 1.097 1.883 
25 8 0.784 2.144 30 8 0.925 2.034 35 8 1.034 1.967 
25 9 0.701 2.280 30 9 0.853 2.141 35 9 0.970 2.054 
25 10 0.621 2.419 30 10 0.782 2.250 35 10 0.907 2.143 
26 2 1302 1.461 31. 2 1.362 1.495 36 2 1.410 1.524 
26 3 1.223 1.552 31 3 1.296 1.570 36 3 1.353 1.587 
26 4 1.143 1.652 31 4 1.229 1.650 36 4 1.295 1.653 
26 5 1.061 1.759 31 5 1.160 1.735 36 5 1.235 1.724 
26 6 0.979 1.872 31 6 1.090 1.825 36 6 1.175 1.798 
26 7 0.897 1.992 31. 7 1.020 1.919 36 7 1.114 1.876 
26 8 0815 2.117 31 8 0.949 2.018 36 8 1.052 1.957 
26 9 0.735 2.246 31 9 0879 2.120 36 9 0.991 2.041 
26 10 0.656 2.378 31 10 0.809 2.225 36 10 0.929 2.127 
27 2 1315 1.468 32 2 1.373 1.501 37 2 1.419 1.529 
27 3 1.239 1.556 32 3 1.309 1.573 37 3 1.363 1.590 
27 4 1162 1.651 32 4 1.243 1.650 37 4 1.306 1.655 
27 5 1.083 1.752 32 5 1.176 1.732 37 5 1.248 1.728 
27 6 1.004 1.860 32 6 1.109 1.818 37 6 1.190 1.794 
27 7 0.924 1.974 32 7 1.040 1.909 37 7 1.130 1.869 
27 8 0.845 2.093 32 8 0.972 2.003 37 8 1.070 1.947 
27 9 0.767 2.215 32 9 0.904 2.101 37 9 1.010 2.028 
27 10 0.690 2.341 32 10 0.836 2.202 37 10 0.950 2.112 
28 2 1.328 1.475 33 2 1.383 1.507 38 2 1.427 1.534 
28 3 1.255 1.559 33 3 1321 1.577 38 3 1.373 1.593 
28 4 1.180 1.650 33 4 1.257 1.651 38 4 1.317 1.656 
28 5 1.104 1.747 33 5 1.192 1.729 38 5 1.261 1.722 
28 6 1.027 1.850 33 6 1.126 1.812 38 6 1.204 1.791 
28 7 0.950 1.958 33 7 1.060 1.899 38 7 1.146 1.864 
28 8 0.873 2.071 33 8 0.994 1.990 38 8 1.087 1.939 
28 9 0.797 2.188 33 9 0.927 2.084 38 9 1.029 2.017 
28 10 0.722 2.308 33 10 0.861 2.181 38 10 0.970 2.097 
29 2 1.340 1.482 34 2 1392 1.513 39 2 1.434 1.539 
29 3 1.269 1.563 34 3 1.332 1.580 39 3 1.382 1.596 
29 4 1.197 1.649 34 4 1.270 1.651 39 4 1.328 1.657 
29 5 1.124 1.742 34 5 1.207 1.727 39 5 1.273 1.721 
29 6 1.049 1.840 34 6 1.143 1.807 39 6 1.217 1.788 
29 7 0.974 1.944 34 7 1.079 1.891 39 7 1.161 1.858 
29 8 0.900 2.051 34 8 1.014 1.978 39 8 1.104 1.931 
29 9 0.826 2.163 34 9 0.949 2.068 39 9 1.046 2.006 
29 10 0.753 2.278 34 10 0.885 2.161 39 10 0.989 2.084 


N =n* casos, q =n* parámetros, DW/¡=límite inferior, DWg=límite superior 


556 Tablas estadísticas 


TABLA | (continuación) 


N q DW,  DWSs N q DW,  DWs N q DW,  DWSs 
40 2 1.442 1.544 45 2 1.475 1.566 50 2 1.503 1.584 
40 3 1.390 1.599 45 3 1.429 1.614 50 3 1.462 1.628 
40 4 1.338 1.658 45 4 1.383 1.666 50 4 1.420 1.673 
40 5 1.284 1.720 45 5 1335 1.719 50 5 1.377 1.721 
40 6 1230 1.785 45 6 1.287 1.776 50 6 1.334 1.770 
40 7 1.175 1.853 45 7 1.238 1.834 50 7 1.290 1.822 
40 8 1.119 1.924 45 8 1.188 1.895 50 8 1.246 1.875 
40 9 1.063 1.997 45 9 1.139 1.957 50 9 1.201 1.929 
40 10 1.007 2.072 45 10 1.088 2.022 50 10 1.155 1.985 
41 2 1.449 1.548 46 2 1.481 1.569 51 2 1508 1.588 
41 3 1.399 1.603 46 3 1436 1.617 51 3 1.468 1.630 
41 4 1.348 1.660 46 4 1391 1.667 51 4 1.427 1.675 
41 5 1295 1.720 46 5 1344 1.720 51 5 1.385 1.721 
41 6 1.242 1.783 46 6 1.297 1.774 51 6 1.343 1.770 
41 7 1.189 1.849 46 7 1.249 1.831 51 7 1.299 1.820 
41 8 1.134 1.917 46 8 1.201 1.890 51 8 1.256 1.871 
41 9 1.080 1.988 46 9 1.152 1.951 51. 9 1212 1.925 
41 10 1.025 2.060 46 10 1.103 2.014 51 10 1.167 1.979 
42 2 1.456 1.553 47 2 1.487 1.573 52 2 1513 1.591 
42 3 1.407 1.606 47 3 1.443 1.620 52 3 1.474 1.633 
42 4 1.357 1.661 47 4 1.398 1.669 52 4 1.433 1.676 
42 5 1.306 1.720 47 5 1353 1.720 52 5 1392 1.722 
42 6 1254 1.781 47 6 1.307 1.773 52 6 1.351 1.769 
42 7 1.202 1.845 47 7 1.260 1.828 52 7 1.308 1.818 
42 8 1.149 1.911 47 8 1.213 1.886 52 8 1.266 1.868 
42 9 1.095 1.979 47 9 1.165 1.945 52 9 1.222 1.920 
42 10 1.042 2.050 47 10 1.117 2.006 52 10 1.179 1.974 
43 2 1.462 1.557 48 2 1.492 1.577 53 2 1518 1.595 
43 3 1.415 1.609 48 3 1450 1.623 53 3 1.479 1.635 
43 4 1366 1.663 48 4 1.406 1.670 53 4 1.440 1.678 
43 5 1316 1.720 48 5 1361 1.720 53 5 1.400 1.722 
43 6 1.266 1.779 48 6 1316 1.772 53 6 1.359 1.768 
43 7 1214 1.841 48 7 1.270 1.826 53 7 1317 1816 
43 8 1.162 1.905 48 8 1.224 1.882 53 8 1.275 1.865 
43 9 1.110 1.971 48 9 1.177 1.939 53 9 1.233 1.916 
43 10 1.058 2.040 48 10 1.130 1.999 53 10 1.190 1.968 
44 2 1.469 1.561 49 2 1.498 1.581 54 2 1523 1.598 
44 3 1422 1.611 49 3 1456 1.625 54 3 1.485 1.638 
44 4 1374 1.664 49 4 1.413 1.672 54 4 1.446 1.679 
44 5 1.326 1.719 49 5 1370 1.720 54 5 1.406 1.728 
44 6 1276 1.777 49 6 1325 1.771 54 6 1366 1.768 
44 7 1.226 1.837 49 7 1.280 1.824 54 7 1326 1.815 
44 8 1.176 1.900 49 8 1.235 1.878 54 8 1.285 1.863 
44 9 1.125 1.964 49 9 1.189 1.934 54 9 1.243 1.912 
44 10 1.073 2.030 49 10 1.143 1.992 54 10 1.201 1.963 


N =n* casos, q =n* parámetros, DW¿=límite inferior, DWg=límite superior 


Tablas estadísticas 557 


TABLA | (continuación) 


N q DW,  DWSs N q DW,  DWSs N q DW,  DWs 
55 2 1527 1.601 60 2 1548 1.616 80 2 1611 1.661 
55 3 1.490 1.640 60 3 1514 1.651 80 3 1585 1.688 
55 4 1452 1.681 60 4 1479 1.688 80 4 1560 1.715 
55 5 1413 1.723 60 5 1444 1.727 80 5 1533 1.743 
55 6 1374 1.768 60 6 1.408 1.767 80 6 1507 1.771 
55 7 1334 1.813 60 7 1.371 1.808 80 7 1.479 1.800 
55 8 1.294 1.860 60 8 1.334 1.850 80 8 1.452 1.830 
55 9 1.253 1.909 60 9 1.297 1.893 80 9 1.424 1.861 
55 10 1.211 1.959 60 10 1.259 1.938 80 10 1.396 1.892 
56 2 1531 1.604 62 2 1556 1.621 85 2 1.623 1.671 
56 3 1.495 1.642 62 3 1.523 1.656 85 3 1599 1.695 
56 4 1.458 1.683 62 4 1489 1.691 85 4 1575 1.721 
56 5 1420 1.724 62 5 1455 1.728 85 5 1550 1.746 
56 6 1381 1.767 62 6 1420 1.767 85 6 1525 1.773 
56 7 1342 1.812 62 7 1.385 1.806 85 7 1500 1.800 
56 8 1.302 1.858 62 8 1.349 1.847 85 8 1.474 1.828 
56 9 1.262 1.905 62 9 1.313 1.888 85 9 1.448 1.857 
56 10 1.222 1.954 62 10 1.277 1.931 85 10 1.422 1.886 
57 2 1536 1.607 65 2 1566 1.629 90 2 1.634 1.679 
57 3 1500 1.645 65 3 1535 1.662 90 3 1.611 1.702 
57 4 1.463 1.684 65 4 1.503 1.696 90 4 1588 1.726 
57 5 1426 1.725 65 5 1470 1.731 90 5 1565 1.750 
57 6 1.388 1.767 65 6 1437 1.767 90 6 1542 1.775 
57 7 1350 1.811 65 7 1.404 1.804 90 7 1518 1.801 
57 8 1311 1.856 65 8 1370 1.842 90 8 1.493 1.827 
57 9 1.271 1.902 65 9 1.335 1.882 90 9 1.469 1.854 
57 10 1.232 1.950 65 10 1.301 1.922 90 10 1.444 1.881 
58 2 1540 1.610 70 2 1583 1.641 95 2 1.644 1.687 
58 3 1505 1.647 70 3 1554 1.671 95 3 1.623 1.709 
58 4 1.469 1.685 70 4 1524 1.702 95 4 1601 1.731 
58 5 1432 1.725 70 5 1494 1.735 95 5 1579 1.754 
58 6 1.395 1.767 70 6 1.463 1.768 95 6 1557 1.778 
58 7 1.357 1.810 70 7 1432 1.802 95 7 1534 1.802 
58 8 1319 1.854 70 8 1.401 1.837 95 8 1511 1.826 
58 9 1.280 1.899 70 9 1.369 1.873 95 9 1488 1.851 
58 10 1.241 1.946 70 10 1.337 1.910 95 10 1.465 1.877 
59 2 1544 1.613 75 2 1598 1.652 100 2 1.654 1.694 
59 3 1509 1.649 75 3 1.570 1.680 100 3 1633 1.715 
59 4 1.474 1.687 75 4 1543 1.709 100 4 1613 1.736 
59 5 1.438 1.726 75 5 1515 1.739 100 5 1592 1.758 
59 6 1.401 1.767 75 6 1486 1.769 100 6 1571 1.780 
59 7 1.364 1.809 75 7 1.457 1.801 100 7 1.549 1.803 
59 8 1.327 1.852 75 8 1428 1.833 100 8 1.527 1.826 
59 9 1.289 1.896 75 9 1.398 1.866 100 9 1.506 1.849 
59 10 1.250 1.942 75 10 1.368 1.900 100 10 1.483 1.874 


Fuente: elaboración propia. 


558 Tablas estadísticas 


TABLA J. Valores límite del estadístico Durbin Watson (a =.01) 


N q DW,  DWSs N q DW,  DWs N q DW,  DWs 
6 2 0.389 1.142 15 2 0.811 1.070 20 2 0.052 1.146 
7 2 0.435 1.036 15 3 0.699 1.251 20 3 0.863 1.270 
7 3 0.294 1.676 15 4 0.591 1.464 20 4 0.773 1.410 
8 2 0.497 1.002 15 5 0.487 1.704 20 5 0.684 1.566 
8 3 0.345 1.488 15 6 0.390 1.966 20 6 0.598 1.736 
8 4 0.229 2.101 15 7 0.302 2.244 20 7 0514 1.918 
9 2 0.553 0.997 15 8 0.225 2.529 20 8 0.435 2.109 
9 3 0.408 1.388 15 9 0.160 2.816 20 9 0.361 2.307 
9 4 0.279 1.875 15 10 0.108 3.100 20 10 0.293 2.510 
9 5 0.183 2.432 16 2 0.843 1.086 21 2 0.975 1.160 
10 2 0.604 1.000 16 3 0.737 1.252 21 3 0.889 1.276 
10 3 0.465 1.332 16 4 0.632 1.445 21 4 0.803 1.408 
10 4 0.339 1.733 16 5 0.531 1.662 21 5 0.717 1.553 
10 5 0.230 2.193 16 6 0.436 1.900 21 6 0.633 1.711 
10 6 0.149 2.690 16 7 0.348 2.153 21 7 0551 1.880 
11 2 0.652 1.009 16 8 0.269 2.415 21 8 0.473 2.058 
11 3 0.518 1.296 16 9 0.200 2.680 21 9 0.400 2.243 
11 4 0.395 1.640 16 10 0.142 2.944 21 10 0.331 2.433 
11 5 0.286 2.029 17 2 0.873 1.102 22 2 0.997 1.173 
11 6 0.192 2.452 17 3 0.772 1.255 22 3 0.914 1.283 
11 7 0.124 2.892 17 4 0.671 1.431 22 4 0.831 1.406 
12 2 0.697 1.023 17 5 0.573 1.630 22 5 0.748 1.542 
12 3 0.569 1.273 17 6 0.480 1.846 22 6 0.666 1.690 
12 4 0.448 1.574 17 7 0.392 2.077 22 7 0.587 1.848 
12 5 0.339 1.913 17 8 0.312 2.319 22 8 0510 2.015 
12 6 0.244 2.279 17 9 0.240 2.565 22 9 0.437 2.188 
12 7 0.163 2.664 17 10 0.178 2.811 22 10 0.368 2.366 
12 8 0.105 3.052 18 2 0.901 1.117 23 2 1.017 1.186 
13 2 0.738 1.038 18 3 0.804 1.259 23 3 0.937 1.290 
13 3 0.616 1.260 18 4 0.707 1.422 23 4 0.857 1.406 
13 4 0.499 1.525 18 5 0.613 1.604 23 5 0.777 1.534 
13 5 0.390 1.825 18 6 0.521 1.802 23 6 0.698 1.672 
13 6 0.293 2.149 18 7 0.435 2.015 23 7 0.620 1.820 
13 7 0.210 2.490 18 8 0.355 2.237 23 8 0.545 1.977 
13 8 0.140 2.838 18 9 0.281 2.466 23 9 0.472 2.139 
13 9 0.089 3.182 18 10 0.216 2.697 23 10 0.404 2.307 
14 2 0.776 1.054 19 2 0.927 1.132 24 2 1.036 1.198 
14 3 0.659 1.254 19 3 0.834 1.264 24 3 0.059 1.297 
14 4 0.546 1.490 19 4 0.741 1.415 24 4 0.882 1.407 
14 5 0.440 1.757 19 5 0.650 1.583 24 5 0.804 1.527 
14 6 0.342 2.048 19 6 0.561 1.766 24 6 0.727 1.658 
14 7 0.256 2.353 19 7 0.476 1.962 24 7 0.652 1.797 
14 8 0.183 2.667 19 8 0.3968 2.168 24 8 0.578 1.943 
14 9 0.121 2.981 19 9 0.322 2.381 24 9 0.507 2.097 
14 10 0.778 3.287 19 10 0.255 2.597 24 10 0.439 2.255 


N =n* casos, q =n* parámetros, DW=límite inferior, DWg=límite superior 


Tablas estadísticas 559 


TABLA y (continuación) 


N q DW,  DWSs N q DW,  DWs N q DW,  DWSs 
25 2 1.054 1.210 30 2 1.133 1.263 35 2 1.195 1.307 
25 3 0.980 1.304 30 3 1.070 1.338 35 3 1.140 1.370 
25 4 0.905 1.408 30 4 1.006 1.421 35 4 1.084 1.438 
25 5 0830 1.522 30 5 0.941 1.510 35 5 1.028 1511 
25 6 0.755 1.645 30 6 0.876 1.605 35 6 0.971 1.589 
25 7 0.682 1.776 30 7 0.811 1.707 35 7 0914 1.671 
25 8 0.609 1.914 30 8 0.747 1.813 35 8 0.857 1.757 
25 9 0.539 2.059 30 9 0.684 1.925 35 9 0.800 1.847 
25 10 0.472 2.208 30 10 0.622 2.041 35 10 0.744 1.940 
26 2 1.072 1.222 31. 2 1.146 1.272 36 2 1.206 1.314 
26 3 1.000 1.311 31 3 1.085 1.345 36 3 1.152 1.376 
26 4 0.928 1.410 31. 4 1.023 1.424 36 4 1.098 1.442 
26 5 0.855 1.518 31 5 0.960 1.510 36 5 1.043 1512 
26 6 0.782 1.634 31 6 0.897 1.601 36 6 0.988 1.587 
26 7 0.710 1.758 31 7 0.834 1.698 36 7 0.932 1.666 
26 8 0.640 1.889 31 8 0.771 1.799 36 8 0.876 1.749 
26 9 0571 2.026 31 9 0.709 1.906 36 9 0.821 1.835 
26 10 0.505 2.167 31 10 0.648 2.016 36 10 0.765 1.925 
27 2 1.088 1.233 32 2 1.159 1.281 3 2 pla. Haedo 
27 3 1.019 1.318 32 3 1.100 1.351 37 3 1.164 1.382 
27 4 0.949 1.412 32 4 1.039 1.428 37 4 1111 1.445 
27 5 0878 1.515 32 5 0.978 1.509 37 5 1.058 1.513 
27 6 0.807 1.625 32 6 0.917 1.597 37 6 1.003 1.586 
27 7 0.737 1.743 32 7 0.855 1.690 37 7 0.949 1.662 
27 8 0.668 1.867 32 8 0.79% 1.787 37 8 0.895 1.741 
27 9 0.601 1.996 32 9 0.733 1.889 37 9 0.840 1.825 
27 10 0.536 2.130 32 10 0.674 1.995 37 10 0.786 1.911 
28 2 1.104 1.243 33. 2 1472 “1290 38 2 1.226 1.329 
28 3 1.037 1.325 33 3 1.114 1.358 38 3 1.176 1.387 
28 4 0.969 1.415 33 4 1.055 1.431 38 4 1.124 1.449 
28 5 0.900 1.513 33 5 0.995 1.510 38 5 1.072 1.515 
28 6 0.831 1.617 33 6 0.936 1.594 38 6 1.019 1.585 
28 7 0.763 1.729 33 7 0.876 1.682 38 7 0.966 1.658 
28 8 0.696 1.847 33 8 0816 1.776 38 8 0.912 1.735 
28 9 0.630 1.970 33 9 0.757 1.873 38 9 0.859 1.815 
28 10 0.566 2.097 33 10 0.698 1.975 38 10 0.806 1.898 
29 2 1.119 1.253 34 2 1.183 1.298 39 2 1.236 1.337 
29 3 1.053 1.332 34 3 1.127 1.364 39 3 1.186 1.393 
29 4 0.987 1.418 34 4 1.070 1.435 39 4 1.136 1.453 
29 5 0921 1511 34 5 1012 1510 39 5 1.085 1.516 
29 6 0.854 1.611 34 6 0.954 1.591 39 6 1.033 1.584 
29 7 0.788 1.717 34 7 0.895 1.676 39 7 0.981 1.655 
29 8 0.722 1.829 34 8 0.837 1.766 39 8 0.929 1.729 
29 9 0.657 1.946 34 9 0.779 1.859 39 9 0.877 1.806 
29 10 0.594 2.067 34 10 0.721 1.956 39 10 0.825 1.887 


N =n* casos, q =n* parámetros, DW/=límite inferior, DWg=límite superior 


560 Tablas estadísticas 


TABLA y (continuación) 


N q DW,  DWSs N q DW,  DWs N q DW,  DWs 
40 2 1.245 1.344 45 2 1.288 1.376 50 2 1.324 1.403 
40 3 1.197 1.398 45 3 1.245 1.428 50 3 1.285 1.445 
40 4 1.148 1.456 45 4 1.200 1.474 50 4 1.245 1.490 
40 5 1.098 1.518 45 5 1.156 1.528 50 5 1.205 1.587 
40 6 1.047 1.583 465 6 1.111 1.584 50 6 1.164 1.587 
40 7 0.997 1.652 45 7 1.065 1.643 50 7 1.122 1.638 
40 8 0.946 1.724 45 8 1.019 1.704 50 8 1.081 1.692 
40 9 0.89 1.798 45 9 0.973 1.768 50 9 1.039 1.747 
40 10 0.844 1.876 45 10 0.927 1.834 50 10 0.997 1.805 
41 2 1.255 1.350 46 2 1.295 1.381 51 2 1355 1.427 
41 3 1.207 1.403 46 3 1.253 1.428 51 3 1319 1.465 
41 4 1.159 1.460 46 4 1210 1.478 51 4 1.283 1.506 
41 5 1.110 1.520 46 5 1.166 1.530 51. 5 1.246 1.548 
41 6 1.061 1.583 46 6 1.122 1.584 51 6 1.209 1.592 
41 7 1.011 1.649 46 7 1.077 1.642 51 7 1.171 1.637 
41 8 0.961 1.719 46 8 1.032 1.701 51 8 1.133 1.685 
414 9 0912 1.791 46 9 0.987 1.763 51 9 1.095 1.734 
41 10 0.862 1.866 46 10 0.942 1.827 51 10 1.056 1.784 
42 2 1.263 1.357 47 2 1.303 1.387 52 2 1.382 1.448 
42 3 1.217 1.408 47 3 1.261 1.432 52 3 1.350 1.483 
42 4 1.170 1.463 47 4 1219 1.480 52 4 1316 1.520 
42 5 1122 1.521 47 5 1.176 1531 52 5 1.282 1.558 
42 6 1.074 1.583 47 6 1.133 1.584 52 6 1.248 1.598 
42 7 1.025 1.647 47 7 1.089 1.640 52 7 1.213 1.639 
42 8 0.977 1.714 47 8 1.045 1.698 52 8 1.178 1.681 
42 9 0.928 1.784 47 9 1.001 1.758 52 9 1.143 1.725 
42 10 0.879 1.857 47 10 0.056 1.821 52 10 1.108 1.770 
43 2 1.272 1.363 48 2 1310 1.392 53 2 1.407 1.467 
43 3 1226 1.413 48 3 1.269 1.437 53 3 1.376 1.500 
43 4 1.181 1.467 48 4 1.228 1.484 53 4 1.345 1.533 
43 5 1.134 1.528 48 5 1.186 1.533 53 5 1314 1.568 
43 6 1.087 1.583 48 6 1.143 1.585 53 6 1.282 1.604 
43 7 1.039 1.645 48 7 1.100 1.639 53 7 1.250 1.641 
43 8 0.991 1.710 48 8 1.057 1.696 53 8 1.218 1.680 
43 9 0.943 1.778 48 9 1.014 1.754 53 9 1.185 1.719 
43 10 0.895 1.848 48 10 0.970 1.815 53 10 1.152 1.760 
44 2 1.280 1.369 49 2 1.317 1.397 54 2 1.428 1.485 
44 3 1236 1.418 49 3 1.277 1.441 54 3 1.400 1.514 
44 4 1.191 1.470 49 4 1.237 1.487 54 4 1371 1.545 
44 5 1.145 1.525 49 5 1.195 1.535 54 5 1.342 1.577 
44 6 1.099 1.583 49 6 1.154 1.586 54 6 1313 1.610 
44 7 1.052 1.644 49 7 1.112 1.639 54 7 1.283 1.644 
44 8 1.005 1.707 49 8 1.069 1.694 54 8 1.253 1.680 
44 9 0.958 1.773 49 9 1.026 1.751 54 9 1222 1.716 
44 10 0.911 1.841 49 10 0.984 1.810 54 10 1.192 1.753 


N =n? casos, q =n* parámetros, DW/=límite inferior, DWs=límite superior 


Tablas estadísticas 561 


TABLA y (continuación) 


N q DW,  DWs N q DW,  DWSs N q DW,  DWs 
55 2 1355 1.427 60 2 1382 1.448 80 2 1465 1.515 
55 3 1319 1.465 60 3 1.350 1.483 80 3 1.440 1.541 
55 4 1.283 1.506 60 4 1316 1.520 80 4 1415 1.567 
55 5 1.246 1.548 60 5 1.282 1.558 80 5 1.390 1.595 
55 6 1.209 1.592 60 6 1.248 1.598 80 6 1.364 1.623 
55 7 1.171 1.637 60 7 1.213 1.639 80 7 1.338 1.652 
55 8 1.133 1.685 60 8 1.178 1.681 80 8 1.312 1.682 
55 9 1.095 1.734 60 9 1.143 1.725 80 9 1.285 1.713 
55 10 1.056 1.784 60 10 1.108 1.770 80 10 1.259 1.745 
56 2 1361 1.431 62 2 1392 1.456 85 2 1.481 1.528 
56 3 1.326 1.469 62 3 1.361 1.490 85 3 1458 1.552 
56 4 1.290 1.509 62 4 1328 1.525 85 4 1.434 1.577 
56 5 1.254 1.550 62 5 1.296 1.562 85 5 1410 1.603 
56 6 1.217 1.593 62 6 1.262 1.600 85 6 1.386 1.629 
56 7 1.180 1.638 62 7 1229 1.640 85 7 1361 1.657 
56 8 1.143 1.684 62 8 1.195 1.680 85 8 1.337 1.684 
56 9 1.105 1.732 62 9 1161 1.722 85 9 1312 1.713 
56 10 1.067 1.781 62 10 1.126 1.766 85 10 1.287 1.743 
57 2 1.366 1.436 65 2 1.407 1.467 90 2 1.496 1.540 
57 3 1.332 1.473 65 3 1.376 1.500 90 3 1.474 1.563 
57 4 1.297 1.511 65 4 1345 1.533 90 4 1451 1.586 
57 5 1.261 1.552 65 5 1314 1.568 90 5 1429 1.611 
57 6 1.225 1.594 65 6 1.282 1.604 90 6 1.406 1.635 
57 7 1.189 1.638 65 7 1250 1.641 90 7 1.383 1.661 
57 8 1.152 1.683 65 8 1.218 1.680 90 8 1.359 1.687 
57 9 1.115 1.730 65 9 1185 1.719 90 9 1336 1.714 
57 10 1.078 1.778 65 10 1.152 1.760 90 10 1312 1.741 
58 2 1372 1.440 70 2 1428 1.485 95 2 1509 1.551 
58 3 1.338 1.476 70 3 1.400 1.514 95 3 1.489 1.573 
58 4 1303 1.514 70 4 1371 1.545 95 4 1.467 1.595 
58 5 1.268 1.554 70 5 1342 1.577 95 5 1446 1.618 
58 6 1.233 1.595 70 6 1313 1.610 95 6 1424 1.641 
58 7 1.197 1.638 70 7 1283 1.644 95 7 1.402 1.665 
58 8 1.161 1.682 70 8 1.253 1.680 95 8 1.380 1.690 
58 9 1.125 1.729 70 9 1222 1.716 95 9 1.358 1.715 
58 10 1.088 1.775 70 10 1.192 1.753 95 10 1.335 1.740 
59 2 1377 1.444 75 2 1.448 1.500 100 2 1522 1.562 
59 3 1.344 1.480 75 3 1421 1.528 100 3 1502 1.582 
59 4 1310 1.517 75 4 1394 1.557 100 4 1482 1.603 
59 5 1.276 1.556 75 5 1.367 1.586 100 5 1462 1.625 
59 6 1.241 1.596 75 6 1340 1.617 100 6 1441 1.647 
59 7 1.205 1.638 75 7 1312 1.648 100 7 1.420 1.669 
59 8 1.170 1.682 75 8 1.284 1.681 100 8 1.399 1.693 
59 9 1.134 1.727 75 9 1255 1.714 100 9 1378 1.716 
59 10 1.098 1.773 75 10 1227 1.748 100 10 1.356 1.740 


Fuente: elaboración propia 


562 Tablas estadísticas 


TABLA K. Cuantiles superiores (q) de la distribución de rango estudentizado (a.=.05) 


Valor q, tal que P(t > |qy1, |) =.05 
2 3 4 E 6 7 8 9 10 11 12 
17.97 | 26.98 | 32.82 | 37.08 | 40.41 | 43.12 | 45.40 | 47.36 | 49.07 | 50.59 | 51.96 
6.09 | 8.33 | 9.80 | 10.88 | 11.73 | 12.43 | 13.03 | 13,54 | 13.99 | 14.40 | 14.76 
4.50 | 5.91 | 6.83 | 7.50| 804 | 848 | 885 9.18 946 | 9.72 | 9.95 
3.93 | 5.04 | 5.76 | 6.29 | 6.71 7.05 |  7.35| 7.60 | 7.83 | 8.03 | 8.21 
3.64 | 460 | 522| 5.67 | 6.03 | 6.33 | 6.58 | 6.80 | 7.00 | 7.17 | 7.32 
3.46 | 434 | 490 | 5.31 | 563 5.90 6.12 | 6.32 | 6.49 | 6.65 | 6.79 
3.34 | 4.17 | 4.68 | 5.06 | 5.36 5.61 5.82 | 6.00 | 6.16 | 6.30 | 6.43 
3.26 | 404 | 453| 4.89 | 5.17 5.40 5.60 | 5.77 | 5.92 | 6.05 | 6.18 
320 | 395| 442 | 4.76 | 5.02 524 543 | 5.60 | 5.74 | 5.87 | 5.98 
3.15 | 3.88 | 433| 465| 491 | 512 | 530| 546 | 5.60 | 5.72 | 5.83 
3.11 | 3.82 | 426 | 4.57 | 4.82 5.03 |  520| 5.35| 5.49| 5.61 | 5.71 
3.08 | 3.77 | 420 | 4.51 | 475 495 |  5.12| 5.27 | 5.40| 5.51 | 5.62 
3.06 | 3.73 | 4.15| 445| 4.69 4.88 5.05 | 5.19 | 5.332| 5.43 | 5.53 
3.03 | 3.70| 4.11 | 441 | 464 483 |  499| 5.13| 525| 5.36 | 5.46 
3.01 | 3.67 | 408 | 437| 460 4.78 | 4.94 | 5.08 | 520| 5.31 | 5.40 
3.00 | 3.65 | 4.05 | 4.33 | 456 474 | 490 | 5.003 | S5.15| 5.26| 5.35 
2.98 | 3.63 | 402 | 430| 452 | 471 | 486 | 4.99 | 5.11| 5.21| 5.31 
2.97 | 3.61 | 400 | 428| 449 | 467 | 4.82 | 4.96 | 5.07 | 5.17 | 5.27 
2.96 | 3.59| 398 | 425| 447 | 465 | 479 4.92 | 5.04 | 5.14 | 5.23 
2.95 | 3.58| 396 | 423| 445, 462 | 4.77 | 490| 5.01 | 5.11 | 5.20 
2.94 | 3.56 | 394 | 421| 443 | 460 | 474 | 4.87 | 4.98 | 5.08 | 5.17 
2.93 | 3.55| 393 | 420| 441] 458 | 472 4.85 | 4.96 | 5.05 | 5.15 
2.93 | 3.54 | 391 | 418| 439 | 456 | 470 | 483 | 494 | 5.03 | 5.12 
24 | 292 | 353| 390| 4.17 | 437| 454 | 468 | 481 | 492 | 5.01 | 5.10 
25| 291 | 352| 389| 415| 436| 453| 467 479 | 490 | 5.08 | 5.16 
26 | 2.91 | 3.51 | 388| 4.14| 434 | 451 | 465 | 478 | 489| 4.97 | 5.06 
27| 2.90 | 3.51 | 387| 4.13| 433| 450| 463 | 476 | 4.87 | 4.96 | 5.04 
28| 290| 3.50| 386| 4.12| 432 | 448 | 462 | 475 | 486 | 4.94 | 5.03 
29| 2.89 | 349 | 385| 4.11 | 431 | 447 | 461 | 473 | 484 | 493 | 5.01 
30| 289| 349| 385| 410| 430, 446 | 460| 472| 482 | 4.92 | 5.00 
32 | 2.88 | 3.48 | 3.83 | 409| 428 | 444 | 458 | 470 | 4.81 | 4.89 | 4.98 
34 | 2.87 | 3.47| 382 | 407 | 427 | 443 | 456 | 4.69 4.79 | 4.87 | 4.96 
36 | 2.87 | 346 | 3.81 | 406 | 425 | 441 | 455 | 4.66 | 4.77 | 4.85 | 4.94 
38 | 2.86 | 3.45| 3.80 | 405| 424 | 440 | 453 | 4.64 | 4.75| 4.84 | 4.92 
40| 286 | 344 | 379| 404| 423| 439| 452 | 463 | 473| 482 | 4.90 
50 | 2.84 | 341 | 3.76 | 400| 419 | 434 | 447 4.58 4.69 | 4.76 | 4.85 
60| 2.83 | 340 | 3.74 | 398 | 416 | 431 | 444 | 455 | 4.65| 4.73 | 4.81 
120| 2.80 | 3.36 | 3.68| 392 | 410| 424| 436 | 447 | 456| 4.64 | 4.71 
oc 2.77 | 3.31 | 3.63 | 3.86 | 403 | 417 | 429 | 4.39 | 447 | 4.55 | 4.62 


Fuente: Elaboración propia 
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Tablas estadísticas 


TABLA L. Cuantiles superiores (q) de la distribución de rango estudentizado (0.=.01) 


Valor q, tal que P(t > (921; 1) = 01 
e] 


gl|k 2 3 4 6 7 8 9 10 11 12 
1 | 90.02 | 135.0 | 164.30 | 185.6 | 202.2 | 215.8 | 227.2 | 237.0 | 245.6 | 253.2 | 260.0 
2 | 14.04 | 19.02 22.29 | 24.72 | 26.63 | 28.20 | 29.53 | 30.68 | 31.69 | 32.59 | 33.40 
3 | 8.26 | 10.62 12.17 | 13.32 | 14.24 | 15.00 | 15.65 | 16.21 | 16.69 | 17.13 | 17.53 
4| 6.51 | 8.12 9.17 9.96 10.58 [| 11.10 | 11.54 | 11.92 | 1226 | 12.57 | 12.84 
5| 570, 6.98 7.80 8.42 8.91 9.32 9.67 9.97 |10.24 | 10.48 | 10.70 
6 | 5.24 | 6.33 7.03 7.56 7.97 8.32 8.61 8.87 9.10 9.30 9.49 
7| 495 | 5.92 6.54 7.01 7.37 7.68 7.94 8.17 8.37 8.55 8.71 
8| 475 | 5.64 6.20 6.63 6.96 7.24 7.47 7.68 7.86 8.03 8.18 
9| 4,60 | 5.43 5.96 6.35 6.66 6.92 7.13 133 7.49 7.65 7.78 

10 | 4.48 | 5.27 5.77 6.14 6.43 6.67 6.88 7.05 7.21 7.36 7.49 
11| 439| 5.15 5.62 5.97 6.25 6.48 6.67 6.84 6.99 7.13 7.25 
12| 4.32 | 5.05 5.50 5.84 6.10 6.32 6.51 6.67 6.81 6.94 7.06 
13| 426 | 4.96 5.40 5.73 5.98 6.19 6.37 6.53 6.67 6.79 6.90 
14| 421 | 4.90 5.32 5.63 5.88 6.09 6.26 6.41 6.54 6.66 6.77 
15| 4.17 | 4.84 5.25 5.56 5.80 5.99 6.16 6.31 6.44 6.56 6.66 
16 | 4.13 | 4.79 519 5.49 5.12 5.92 6.08 6.22 6.35 6.46 6.56 
17| 4.10 | 4.74 5.14 5.43 5.66 5.85 6.01 6.15 6.27 6.38 6.48 
18 | 4.07 | 4.70 5.09 5.38 5.60 5.79 5.94 6.08 6.20 6.31 6.41 
19 | 4.05 | 4.67 5.05 5.33 35 5.74 5.89 6.02 6.14 6.25 6.34 
20| 402 | 4.64 5.02 5.29 5.51 5.69 5.84 5.97 6.09 6.19 6.29 
21| 400 4.61 4.99 5.26 5.47 5.65 5.80 5.92 6.04 6.14 6.24 
22| 3.99 4.58 4.96 5.22 5.43 5.61 5.76 5.88 6.00 6.10 6.19 
23| 3.97 4.56 4.93 5.20 5.40 5.57 5.72 5.84 5.96 6.06 6.15 
24| 396 4.55 4.91 Sl 5.37 5.54 5.69 5.81 5.92 6.02 6.11 
25| 394 | 4,53 4.89 5.14 5.35 5.51 5.65 5.79 5.89 5.99 6.07 
26 | 3.93 4.50 4.87 5.12 5.32 5.49 5.63 5.19 5.86 5.95 6.04 
27| 392 | 4.49 4.85 5.10 5.30 5.46 5.61 3.72 5.83 5.93 6.01 
28 | 3.91 4.47 4.83 5.08 5.28 5.44 5.58 5.70 5.80 5.90 5.98 
29| 390 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85 5.93 
30| 3.89 | 4.45 4.80 5.05 5.24 5.40 5.54 5.65 5.76 5.85 5.93 
32 | 3.87 | 4.43 4.77 5.02 5.21 5.37 5.50 5.61 3.72 5.81 5.89 
34 | 3.86 | 4.41 4.75 4.99 5.18 5.34 5.47 5.58 5.68 5.17 5.86 
36 | 3.85 | 4.00 4.73 4.97 13 5.31 5.44 5.19 5.65 5.74 5.82 
38 | 3.84 | 4.38 4.71 4.95 5.13 5.29 5.41 5.52 5.62 5.72 5.80 
40 | 3.83 | 4.37 4.70 4.93 5.11 5.26 5.39 5.50 5.60 5.69 5.76 
50| 3.79 | 4.32 4.64 4.86 5.04 5.19 5.30 5.41 5.51 3:39 5.67 
60 | 3.76 | 4.28 4,59 4.82 5.49 5.13 5.25 5.36 5.45 5.53 5.60 
120| 370| 4.20 4.50 4.71 4.87 5.01 5.12 3.21 5.30 37 5.44 
oc 3.64 | 4.12 4.40 4.60 4.76 4.88 4.99 5.08 5.16 5.23 5.29 
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